Please use this identifier to cite or link to this item:
http://rudar.ruc.dk/handle/1800/2499
|
| Title: | AnHo – en søgemaskine |
| Authors: | Højlt, Marie Rosenstand Hansen, Anne |
| Advisor: | Bulskov, Henrik |
| Keywords: | søgemaskine database vector space model bolean logic model polinfo information retrieval automatisk indeksering termvægt termfrekvens inverse document frequency |
| Examination Date: | 16-Jan-2007 |
| Issue Date: | 31-May-2007 |
| Abstract: | Dette projekt omhandler den søgeproces, der finder sted ved søgning fra et Javaprogram i en fuldtekstdatabase. Med fokus på systemets behandling af forespørgslen, strukturen i databasen samt rangering af søgeresultaterne har vi udviklet en prototype, der afprøver den brugte teori. Teorien omhandler udvalgt litteratur inden for indeksering, normalisering, termvægt og relevansmodeller. Empirien beskæftiger sig, udover den udviklede søgemaskine, AnHo, med Politikens database, Polinfo som eksempeldatabase. Vi udleder, at en strukturering af databasen i form af et inverteret indeks, skabt ud fra dokumenternes termer og termvægte i databasen, med en forudgående normalisering af indekstermerne, er nødvendig for at få et optimalt resultat ud af de indtastede søgetermer. |
| URI: | http://hdl.handle.net/1800/2499 |
| Subject: | Thesis |
| Education: | Datalogi: modul 2 |
| Appears in Collections: | Datalogi rapporter / Computer Science Projects Projektrapporter og specialer / Projectreports and master thesis
|
This item is protected by original copyright
|
Items in RUDAR are protected by copyright, with all rights reserved, unless otherwise indicated.
|