You are on page 1of 11

Joanna Papiska-Kacperek Katedra Informatyki U

Wyszukiwanie informacji w internecie

Materiay dydaktyczne dla studentw I roku

d 2006

Wyszukiwanie informacji w internecie

Wyszukiwanie informacji w internecie


W internecie jest wiele cennych i potrzebnych informacji. Ale stron www jest tak wiele, e czsto trudno jest dotrze do waciwych i wiarygodnych stron. Trudno jest ustali ile jest w sieci witryn, portali i stron atwiej okreli liczb domen i serwerw. Wedug bada NEC Research Institute w 1999 roku istniao 800 milionw stron www. W 2002 roku wyszukiwarka Google przechowywaa w swoich bazach danych ponad 2 miliardy odnonikw1, a w 2005 byo ich ju 8 miliardw Najlepiej jeeli znamy dokadny adres strony z poszukiwanymi wiadomociami, ale niestety tak jest rzadko. Wtedy naley posuy si dostpnymi narzdziami sucymi do wyszukiwania informacji. Narzdzia wyszukiwania informacji w Internecie Obecnie stosowane s nastpujce terminy: wyszukiwarki tekstowe, metawyszukiwarki, multiwyszukiwarki, szperacze, szukacze, katalogi stron internetowych oraz silniki. Sprbujmy to uporzdkowa. Wikszo uytkownikw dzieli wszystkie na trzy grupy: katalogi, wyszukiwarki i specjalisyczne bazy danych. Katalogi stron internetowych Jest to jeden z rodzajw organizacji adresw i kategoryzacji stron internetowych. S to czsto moderowane rcznie, grupowane tematycznie, zbiory adresw internetowych. Autorzy stron lub inne osoby zgaszaj swoje strony do katalogw, zazwyczaj z krtkim opisem, po czym, zwykle po przejrzeniu, strona zostaje wpisana na list pod danym hasem. Katalog stron jest struktur drzewiast: witryny przypisane s, ze wzgldu na swoj zawarto do poszczeglnych kategorii, ktre dziel si na kategorie podrzdne. W sieci s obecnie katalogi globalne (np. DMOZ, Yahoo), regionalne (np. na dany kraj jak Wirtualna Polska czy Interia), tematyczne (zwizane z jedn gazi przemysu, np. katalog stron muzycznych cgm2) oraz katalogi firm (np. polska Panorama Firm3). Najwikszym katalogiem jest DMOZ4. Tworzony jest przez ochotnikw z caego wiata (kilkadziesit tysicy osb). Caa tre DMOZ jest dostpna jako open content w pliku XML, i mona z niej korzysta w dowolnych celach, pod warunkiem, e umieci si link powrotny na stron dmoz (szczegy licencji na stronie http://dmoz.org/license.html ).
1 2

A. amek Ukryty Internet, Magazyn Internet 7/2002 [6] Gazeta myzyczna cgm.pl http://www.cgm.pl/linkownia 3 Panorama Firm http://www.pf.pl 4 Open Directory Project http://dmoz.org

Opracowanie dr in. Joanna Papiska-Kacperek

Wyszukiwanie informacji w internecie

W 1992 roku z inicjatywy Rafaa Maszkowskiego powsta pierwszy katalog stron znajdujcych si w polskim internecie, pniejsze "Polskie Zasoby Sieciowe". Dane przedstawione byy wwczas w postaci czystego ASCII. Rok pniej w zwizku z rozprzestrzenieniem si standardu HTML katalog obsugiwa ju linki hipertekstowe. "Polskie Zasoby Sieciowe" zakoczyy swoj dziaalno w roku 1997. A obecnie najbardziej znane to: polska cz Open Directory Project http://www.dmoz.org/World/Polska Katalog Onet.pl http://katalog.onet.pl Wirtualna Polska http://katalog.wp.pl Katalog WOW http://www.wow.pl Hoga http://www.hoga.pl Wad katalogw jest maa liczba zawartych w nich stron w porwnaniu z innymi narzdziami oraz dugi czas aktualizacji. Powodem s ograniczone ludzkie moliwoci. Strony internetowe powstaj, znikaj i zmieniaj si, a weryfikacja ich zawartoci czy obecnoci wymaga ponownego odwiedzenia ich przez redaktora. Kolejn wad jest rna interpretacja kategori: t sam stron dwie osoby mog umieci w rnych kategoriach. Co moe prowadzi do nieporozumie. Na przykad strona powicona grze w szachy moe zosta umieszczona przez redaktora katalogu w kategorii sport, natomiast szukajcy tej strony bdzie poszukiwa informacji na ten temat w kategorii gry. Wyszukiwarki internetowe Wyszukiwarka internetowa (ang. search engine) to program lub strona internetowa, ktrej zadaniem jest uatwienie uytkownikom internetu znalezienie informacji w sieci. Okrelenie wyszukiwarka stosujemy do: stron internetowych serwisw wyszukujcych - czyli implementacji oprogramowania wyszukujcego dziaajcego z interfejsem WWW oglnodostpnym dla internautw oprogramowania przeznaczonego do indeksowania i wyszukiwania informacji w sieciach komputerowych: internecie, intranecie. Wyszukiwarki tworz automatycznie swoje bazy danych o witrynach. Mona podzieli je na te oparte na analizie treci strony (tekstowe) oraz oparte na analizie topologii sieci. Wyszukiwarki tekstowe przeszukuj internet analizujc zawarto stron. Kiedy uytkownik poda zapytanie, wyszukiwarka odpowie mu czami do stron, ktre uzna, w zalenoci od uytego algorytmu, za najbardziej odpowiednie. Algorytmy te polegaj na informacjach podanych w kodach stron, np. na podanych tytuach, nagwkach i sowach kluczowych. S zatem bardzo podatne na naduycia, przez co uytkownik zamiast uytecznych informacji dostaje linki na strony nie majce nic wsplnego z jego zapytaniem. eby przeciwdziaa temu, wyszukiwarki zaczy stosowa analiz topologii sieci. Wtedy stron

Opracowanie dr in. Joanna Papiska-Kacperek

Wyszukiwanie informacji w internecie

uwaa si za odpowiadajc zapytaniu uytkownika, jeli wiele stron na temat podany w zapytaniu, do niej linkuje. Pocztkow istotno ustala si na podstawie prostej heurystyki5, po czym zwykle uywa si algorytmu losowego skakania po linkach. Pierwsz wyszukiwark, ktra zastosowaa zaawansowane algorytmy analizy topologii sieci by Google. Wyszukiwarki oparte na analizie topologicznej s czsto uwaane za bardzo odporne na naduycia. Ale czstym zjawiskiem s spam-systemy automatycznej wymiany linkw, ktre mog oszuka algorytm wyszukiwarki. Inn form ataku jest stworzenie duej liczby gsto linkowanych stron, z czego wszystkie na ten sam temat. Jest to jednak zadanie trudne i wymagajce duego nakadu pracy, a modyfikujc heurystyk wartoci pocztkowych mona znacznie ograniczy ten proceder. Oprogramowanie wyszukiwarki skada si z dwch oddzielnych moduw, z ktrych pierwszy odwiedza witryny internetowe, analizujc umieszczone na nich teksty, oraz poda za odsyaczami hipertekstowymi do kolejnych stron. Drugi za obsuguje powstajc w ten sposb baz danych, czsto nazywan indeksem. Korzystanie z bazy polega na wpisywaniu poszukiwanych sw i obejrzeniu wywietlonych wynikw w postaci hipertekstowych odsyaczy do stron, ktre zawieraj wpisane wyraenie. Jako pierwsze wywietlane s adresy witryn, ktre bardziej odpowiadaj zadanemu pytaniu. W skad oprogramowania wyszukiwarki wchodz: Crawler, Robot, Pajk, Spider lub Bot czyli robot internetowy modu pobierajcy dokumenty z sieci. Indekser - program analizujcy i oceniajcy. Searcher - interfejs odpowiadajcy na zapytania czyli analizator zapyta + modu prezentacji wynikw. Dochodz do tego: programy konwersji dokumentw, programy archiwizujce repozytorium, programy analizy technik zabronionych [spam], moduy administracyjne. Najwaniejszymi algorytmami stosowanymi w wyszukiwarkach s algorytmy oceny relewancji6 dokumentu wzgldem szukanej frazy oraz algorytmy oceny zawartoci strony. Czsto s strategiczn tajemnic waciciela wyszukiwarki, przesdzajc o jej skutecznoci. Wiadomo o stosowaniu algorytmw: binarnych, waenia czstoci sw TF, PageRank, In-degree, metody Robertsona i Sparcka-Jonesa (1997), metody Robertsona (1994), modelu Markova, metody bazowej B, liczba wizyt (klikohit) i wielu innych.

Heurystyka to metoda znajdowania rozwiza dla ktrej nie ma gwarancji znalezienia rozwizania optymalnego 6 Relewancja- zwizek, zwaszcza logiczny, z rzecz, o ktr chodzi, relewantny - pozostajcy w (log.) zwizku z, odnoszcy si do, stosujcy si do; dostarczajcy dowodu susznoci a. niesusznoci sprawy; istotny dla.

Opracowanie dr in. Joanna Papiska-Kacperek

Wyszukiwanie informacji w internecie

Popraw relewancji wynikw wyszukiwania mona uzyska poprzez grupowanie (clustering), personalizacj, weryfikacja pisowni, tzw. stop-words czyli stop listy oraz tezaurus, czyli podpowiedzi. Google to najpopularniejsza wyszukiwarka na wiecie. W Polsce podobno 80% uytkownikw internetu, szukajc w sieci informacji, korzysta wanie z niej. Google zostao zaoone przez Larry Page'a oraz Sergeya Brina w 1996 roku, jako projekt studencki na Uniwersytecie Stanford. Sowo "googol" to termin matematyczny oznaczajcy 1 ze 100 zerami, czyli 10100. Twrc tego terminu by 9-letni Milton Sirotta, a spopularyzowa go amerykaski matematyk i wuj Sirotty, Edward Kasner. W 1998 roku, Page i Brin zaoyli firm Google Inc. Wyszukiwarka Google jako pierwsza wprowadzia moliwo przeszukiwania nie tylko stron www (czyli plikw HTML), ale take dokumentw zapisanych w formacie PDF, a pniej doszy do nich take teksty zapisane w Wordzie, arkusze Excela, prezentacje wykonane w programie PowerPoint, pliki z rozszerzeniem rtf7 i pliki postscriptowe (.ps). Rozszerzenia te podawane s w wynikach wyszukiwania obok tytuw plikw. Mona rwnie przeszukiwa grafiki (JPG, GIF), grupy dyskusyjne oraz katalogi. Dzi Google to finansowy gigant. W zeszym roku przychody firmy signy 6,1 mld USD, a zysk wynis 2 mld. Google odnotowa w zakoczonym 31 marca 2006 roku kwartale obrotowym 79% wzrost przychodw w porwnaniu z pierwszym kwartaem 2005 roku. Zamkny si one kwot 2,25 mld USD. W styczniu 2006 roku Google wprowadzia na terenie Chin ocenzurowan wersj wyszukiwarki blokujcej dostp do hase: Tajwan, Tybet, Dalajlama, prawa czowieka. Chiska wersja www.google.cn udostpnia tylko strony internetowe zaakceptowane przez chiskie Biuro Bezpieczestwa Publicznego. Protesty wobec polityki firmy Google zorganizowaa organizacja Students for Free Tybet pod hasem No luv 4 Google. Organizacja zachca do zaprzestania korzystania z usug tej firmy. Naley jednak zauway, e wszystkie wyszukiwarki dziaajce wczeniej w Chinach (Baidu, Yahoo!, MSN) rwnie musiay zastosowa si do wymaga wadz chiskich. W 2006 roku pojawiy si informacje o powstaniu kilku konkurencyjnych do Google wyszukiwarek, jedn z nich jest europejska inicjatywa ograniczenia dominacji USA w internecie Quaero (ac. szukam), czyli projekt europejskiej wyszukiwarki internetowej prowadzony przez firmy Thomson, France Telecom, Siemens AG, Thales, Bertin Technologies, Exalead, Jouve, LTU, Vecsys, Empolis, a wspomagany przez instytuty naukowe Inria, Inra, CNRS, Clips Imag, RWTH Aachen, Uniwersytet Karlsruhe. Najpopularniejszymi na wiecie wg Wikipedii s chronologicznie wg daty powstania: Archie (1990 r.), Veronica (1991), JugHead (1991), WWW Wanderer (1992), WebCrawler (1994), AltaVista (1995), MetaCrawler (1995), Google na Uniwersytecie Standforda (pod adresem: http://google.stanford.edu)

Rich Text Format - "wzbogacony" tekst

Opracowanie dr in. Joanna Papiska-Kacperek

Wyszukiwanie informacji w internecie

(1996), HotBot (1996), Google Google.com - jako niezalena firma (1998), MSN Search (2005). A w Polsce: polski Archie (1994), polski Infoseek ICM (1995), Infoseek Onet (1996), polska AltaVista (1996), NetSprint (2001), Szukacz (2003), Gooru (2004). Polska strona http://www.ranking.pl/ ocenia popularno m.in. wyszukiwarek. Ranking obliczany jest na podstawie procentowej liczby wizyt na polskich witrynach dokonanych z wyszukiwarek uczestniczcych w badaniu gemiusTraffic.
lp 1 2 3 4 5 6 7 Tabela 1 Wyszukiwarki-silniki - uytkownicy z Polski Wyszukiwarki-silniki 5.IX.2006 12.IX.2006 11.IX.2006 18.IX.2006 Google 81.2% 82.0% Morfeo 9.0% 9.0% NetSprint 7.6% 7.3% MSN 1.4% 0.6% Szukacz 0.3% 0.4% Yahoo 0.4% 0.5% Altavista 0.1% 0.1% rdo: Ranking.pl http://www.ranking.pl [dostp 2 X 2006] 19.IX.2006 25.IX.2006 81.0% 9.3% 7.4% 1.1% 0.6% 0.5% 0.1%

Poza zestawieniem znalazy si: Onet, Gooru, Szookacz, Overture, Askjeeves, Vivisimo, Yandex, Wisenut, Teoma, Fast, AOL, Netoskop, Excite, Looksmart, Hotbot, Ixquick, Search, Premiera, Seznam, Jyxo, Mamma, Netscape, Iwon, About, Dogpile, Webcrawler, Metacrawler poniewa nie osigny wymaganego puapu 0,1% w ostatnim tygodniu. Trudno jest ustali popularno wyszukiwarek ale czsto cho z rnymi wynikami, to jednak ich kolejno jest zachowana.

Rys.1 Rnice w wynikach bada rdo: M. Grak, Konkurencyjne rankingi wyszukiwarek, [2]

Metawyszukiwarki Czasami na zadane pytanie wyszukiwarka nie wywietli nam adnego adresu lub bdzie ich bardzo mao. Wtedy mona skorzysta z metawyszukiwarek. S to serwisy internetowe, ktre nie posiadaj wasnej bazy danych, ale potrafi wysa nasze zapytanie do kilku lub kilkunastu samodzielnych szperaczy, odebra je od nich i przedstawi w przejrzystej formie.

Opracowanie dr in. Joanna Papiska-Kacperek

Wyszukiwanie informacji w internecie

Wad metawyszukiwarek jest brak dostpu do specyficznych zapyta zoonych jakie daj pojedyncze szperacze. Zalet jest to, e mona zada jedno pytanie do kilku szperaczy przy odwiedzeniu tylko jednego serwisu. Zaoszczdza to czas i daje moliwo przeszukania wikszej czci zasobw internetu. Niektre metawyszukiwarki dodatkowo opracowuj otrzyman list wynikw: Usuwaj powtarzajce si adresy i te, ktre ju nie istniej w internecie, a s jeszcze zapisane w bazie wyszukiwarki. Dodatkowo mog sortowa na rne sposoby wywietlon list. Przykadami Meta-Search Enginesm s Metacrawler, Ixquick, Copernic. Kolejne przykady mona znale na stronie: http://www.waran.com.pl/w_multiwyszukiwarki.htm Wyszukiarki Invisible Web Spora cz materiaw znajdujcych si w internecie jest niedostpna bo "niewidzialna" dla wyszukiwarek. Przybywa jednak serwisw, ktre umoliwiaj zgbianie tych ukrytych zasobw. W opracowaniach mona te spotka si z inn nazw - "Deep Web" (gboka sie). W dotarciu do tych mao znanych zasobw sieci pomagaj specjalistyczne serwisy. Mog to by metabazy - zbiory wyuskanych z sieci kolekcji dotyczcych rnych obszarw wiedzy, albo te serwisy penetrujce okrelony obszar sieci, koncentrujce si na jednej tylko dziedzinie. CompletePlanet8 to metabaza, ktra daje dostp do 90 ty. baz danych i serwisw wyszukiwawczych. Mona do nich dotrze poprzez katalog tematyczny albo na skrty - po sowie kluczowym. Inny serwis to Direct Search9 stworzy przez Gary Price z George Washington University, autorytet w dziedzinie ukrytych rde. To wci rosncy zbir linkw prowadzcych bezporednio do formularzy wyszukiwawczych poszczeglnych baz. Price tworzy take dodatkowe zbiory - np. "Speech & Transcript Center" (kolekcja przemwie, gwnie politycznych), biznesow "Lists of Lists" (z linkami do rankingw, statystyk i innych zestawie); ponadto kolekcj nagra audio i wideo oraz "News Center" gromadzcy serwisy informacyjne. Infomine10 to przykad serwisu wyspecjalizowanego. Jest adresowany do rodowiska akademickiego, powsta zreszt z inicjatywy pracownikw kilku amerykaskich uczelni i bibliotek uniwersyteckich (m.in. University of California i University of Detroit). Gromadzi w swoim katalogu wartociowe materiay przydatne naukowcom i studentom. S to bazy danych, elektroniczne biuletyny, ksiki, artykuy, archiwa list elektronicznych. W sumie ponad 20.000 rde dotyczcych poszczeglnych nauk, np. medycyny, nauk humanistycznych, matematycznych itp. Wasny serwis maj te bibliotekarze - jest to "Librarians' Index to the Internet"11 Znajduje si w nim ponad 8,5 tys. wyselekcjonowanych adresw baz. Kolejnym przykadem jest Academic Info12.
8 9

CompletePlanet http://www.completeplanet.com Direct Search http://www.freepint.com/gary/direct.htm 10 Infomine http://infomine.ucr.edu 11 Librarians' Index to the Internet http://www.lii.org

Opracowanie dr in. Joanna Papiska-Kacperek

Wyszukiwanie informacji w internecie

W "niewidzialn" cz sieci coraz czciej zapuszczaj si wyszukiwarki - a to dziki temu, e wzbogaca si je o moliwo przeszukiwania tekstw zapisanych w rnych formatach. Najwicej takich moliwoci ma obecnie Google, ale jej konkurenci planuj nowe usugi. Formuowanie zapyta do wyszukiwarek Rne wyszukiwarki dysponuj rnymi rodzajami zapyta, jednak pewne zasady s wsplne dla wszystkich narzdzi wyszukujcych. Ich znajomo przyspieszy wyszukiwanie waciwych treci. Przedstawione zapytania niejednokrotnie mona ze sob czy co daje jeszcze lepsze efekty. Wyszukiwanie wedug sw kluczowych Najprostszym sposobem zadawania pytania jest wpisanie poszukiwanego wyrazu lub wyrazw okrelajcych podan przez nas informacj. Wyszukiwarka lub katalog wywietli nam list stron, ktre zawieraj poszukiwane sowo lub sowa, np sowo programista. Moe to jednak spowodowa wywietlenie listy zawierajcej ponad 1000 adresw, ktrej przejrzenie moe sta si czasochonne. W takim przypadku niektre szperacze pozwalaj na przeszukanie otrzymanych wynikw poprzez sformuowanie dodatkowego pytania do bazy, co umoliwi zmniejszenie liczby otrzymanych stron i dokadniejsze wyniki wyszukiwania. Na przykad gdy poszukujemy stron internetowych szk wyszych. Na pytanie szkoy baza wyszukiwarki zwrci nam bardzo du list adresw. Dziki moliwoci przeszukania otrzymanych wynikw zadajemy ponowne pytanie wysze, ograniczajc w ten sposb liczb otrzymanych wynikw. Mona poda wiele sw kluczowych, ale nie naley przesadza z ich liczb i poda je w dobrej kolejnoci. Wyniki wyszukiwania programowanie komputerw, bd inne ni komputerw programowanie. Niektre narzdzia i tak nie czytaj dugich zapyta, np. Google bierze pod uwag tylko 10 sw i ignoruje pewne typowe wyrazy (na przykad angielskie the i and), a take niektre pojedyncze cyfry i litery, poniewa spowalniaj one wyszukiwanie, nie zapewniajc lepszych wynikw. Google informuje szczegowo o wykluczonych czsto uywanych wyrazach na stronie wynikw pod polem wyszukiwania. Wana jest kolejno podawanych wyrazw. Wyszukiwanie frazy Wpisanie do wyszukiwarki dwch sw np. program nauczania spowoduje wywietlenie stron zawierajcych sowo program i witryn zawierajcych wyraz nauczania oraz tych, ktre zawieraj oba sowa. Gdy oba wyrazy umieci w cudzysowie, otrzymamy list zawierajc adresy stron, ktre w swoim tekcie posiadaj dwa sowa obok siebie i to w podanej kolejnoci.

12

Academic Info http://www.academicinfo.net

Opracowanie dr in. Joanna Papiska-Kacperek

Wyszukiwanie informacji w internecie

Wyszukiwanie rozmyte Wyszukiwanie rozmyte polega na uwzgldnieniu rnych form danego wyrazu. W pytaniu podajemy pocztek wyrazu pozosta cz zastpujemy znakiem ? lub *. Znak ? zastpuje tylko jedn liter, za * zastpuje wiksz liczb znakw. Jak wida w podanym przykadzie szukamy oglnie stron na temat poczty. Jednak gdy wpiszemy sowo poczta to wyszukiwarka wywietli nam adresy stron zawierajcych wyraz poczta, a pominie strony zawierajce wyrazy poczty, pocztowy itp. W Google znak ~ oznacza synonim, czyli np.wpisujc ~program znajdziemy w wynikach rwnie sowo software, Konieczno wystpowania wyrazu lub nie Inn moliwo daj nam dwa znaki + i koniecznie ze spacj przed znakiem. Pierwszy wymusza wywietlenie stron, ktre musz zawiera wyraz poprzedzony +. Drugi za wyklucza strony zawierajce dane sowo. Czasem przydaje si, gdy sowo ma kilka znacze. Np. gdy szukamy informacji o protokoach sieciowych moemy poda zapytanie: protok dyplomacja. A zapytanie Wojna wiatowa +I zapewni nam informacje o I Wojnie. Operatory zaawansowane Zastosowanie ich da nam ograniczanie wynikw wyszukiwania do stron z okrelonych krajw lub domen. Domen mona okreli dodajc do wyszukiwanego hasa operator ,,site Operator ten dziaa w przypadku domen sieciowych i domen najwyszego poziomu. Przykady: music site:pl, lemur site:org, rekrutacja site:edu.pl, ranking site:google.com Moemy jeszcze ogranicza: miejsce strony gdzie maj si znajdowa wyszukiwane hasa w tytule lub w jej adresie URL: intitle:"Podstawy informatyki", allintitle:Podstawy
informatyki, inurl: algorytmy struktury, allinurl: algorytmy struktury

typ pliku filetype:pdf OR filetype:ppt "boolean searching" link wewntrz dokumentu link: ki.uni.lodz.pl

Opracowanie dr in. Joanna Papiska-Kacperek

Wyszukiwanie informacji w internecie

Bibliografia [1] Googling to the Max, UC Berkeley - Teaching Library Internet Workshops http://www.lib.berkeley.edu/TeachingLib/Guides/Internet/Google.html [dostp 1 IX 2006] [2] Grak M., Konkurencyjne rankingi wyszukiwarek, IDG Poland SA http://www.internetstandard.pl/news/89938.html [dostp 2 X 2006] [3] Grak M., Kwietniowy ranking wyszukiwarek, IDG Poland SA http://www.internetstandard.pl/news/news.asp?m=29&id=93592 [dostp 1 X 2006] [4] Invisible or Deep Web: What it is, Why it exists, How to find it, and Its inherent ambiguity - UC Berkeley - Teaching Library Internet Workshops http://www.lib.berkeley.edu/TeachingLib/Guides/Internet/InvisibleWeb.html [dostp 1 IX 2006] [5] Jadewska B., Wyszukiwanie informacji, http://www.oeiizk.edu.pl/informa/jazdzewska/infor.html [dostp 1 IX 2006] [6] Leszczyski A., Google: Zarabianie na darmowym, Gazeta Wyborcza on-line, http://serwisy.gazeta.pl/nauka/1,72915,3451172.html [dostp 1 IX 2006] [7] amek A., Ukryty Internet, Magazyn Internet 7/2002, http://www.mi.com.pl/artykul.php?id=232 [dostp 1 IX 2006] [8] Wikipedia Wolna Encyklopedia http:/pl.wikipedia.org/wiki [dostp 10 IX 2006]

Opracowanie dr in. Joanna Papiska-Kacperek

10

Wyszukiwanie informacji w internecie

SPIS TRECI
Narzdzia wyszukiwania informacji w Internecie__________________________ 2
Katalogi stron internetowych_______________________________________________ Wyszukiwarki internetowe ________________________________________________ Metawyszukiwarki ______________________________________________________ Wyszukiarki Invisible Web ________________________________________________ Wyszukiwanie wedug sw kluczowych _____________________________________ Wyszukiwanie frazy _____________________________________________________ Wyszukiwanie rozmyte___________________________________________________ Konieczno wystpowania wyrazu lub nie ___________________________________ Operatory zaawansowane _________________________________________________ 2 3 6 7 8 8 9 9 9

Formuowanie zapyta do wyszukiwarek ________________________________ 8

Bibliografia ________________________________________________________ 10

SPIS TRECI___________________________________________________11

Opracowanie dr in. Joanna Papiska-Kacperek

11

You might also like