Maxim Polyakov: z čeho se skládají vyhledávače a jak se Google stal hlavním (a stále je)
Různé / / April 14, 2023
Jedinou hrozbou pro globálního lídra je vznik neuronových sítí.
Čím větší množství informací na webu, tím více potřebujeme vyhledávače. První místo mezi nimi dlouhodobě pevně obsadil Google. Proč jeho vzhled přinesl revoluci a co očekávat od vývoje webových nástrojů do budoucna, řekl profesor MGIMO a mediální manažer Maxim Polyakov. Lifehacker shrnul svou přednášku na mezioborové konferenci Screenshot_2023, který se konal v Moskvě 25. a 26. března.
Maxim Poljakov
Novinář, mediální manažer, profesor na katedře mezinárodní žurnalistiky MGIMO.
Kdy a proč uživatelé potřebovali vyhledávače
Objem informací na planetě Zemi neustále narůstá. Po staletí se data shromažďovala na analogových zařízeních – nejprve v rukopisech a knihách, později – na vinylových deskách, na filmech a videokazetách.
V roce 1993 tam byly digitální úložiště dat. A od té doby podíl digitálních informací roste. V roce 2002 přišel zlom: objem dat v digitálu se vyrovnal analogovým zdrojům. Digitální věk začal. Od té doby zásoba digitálních dat exponenciálně narostla a s tím se zvýšilo i celkové množství informací na planetě.
Vyvstává problém: není jasné, jak v tomto obrovském množství informací rychle najít to, co potřebujete. To je to, co vyhledávače dělají.
V roce 1998, kdy Google poprvé vstoupil na trh, existovalo na internetu několik vyhledávacích služeb. V Rusku byly k dispozici například portály AltaVista a Lycos a celkem takových zdrojů bylo více než tucet: Netscape, Ask Jeeves, AOL, MSN a další. Google se stal jedním z nich a porazil konkurenty.
Závěry o tom, jak je lepší než jiné vyhledávače, učinil v roce 1999 španělský vědec Ramon Salvera. Koncem 90. let narazil na zajímavou disertační práci ze Stanfordské univerzity. Jmenoval se „Research papers about Google and the Web Base“ a byl publikován v roce 1997. Jeho autory byli postgraduální studenti Sergey Brin a Larry Page.
Salvera si přečetl disertační práci a otestoval hledaný řetězec. A hned napsal článek do městských novin „Navarre Diary“, který nazval „The Google Revolution“.
S Ramonem jsme diskutovali o tom, jaké je tajemství Googlu, a sdílím s vámi závěry – moje i jeho.
Maxim Poljakov
Jak fungovaly vyhledávače před Googlem
Zadejte do vyhledávacího pole žádost - například "železářství". Algoritmus najde dokumenty, které tuto frázi obsahují. Dále vyhledávač spočítá, kolikrát se klíčová slova na stránce opakují. Ty dokumenty, kde je takových odkazů více, spadají na první řádky čísla.
Důležité: vyhledávač neví, o jaký druh stránek se jedná - možná stránky obchodů nebo možná jen zdroje, které píší o stavebnictví. Algoritmus proto nemůže určit, jak užitečné dokumenty ve výsledcích vyhledávání budou pro uživatele užitečné. Výsledkem je, že člověk dostane dlouhý seznam stránek a každou stránku musí otevřít a dlouho mezi nimi hledat ty správné.
Jak Google zásadně změnil pravidla vyhledávání
Hlavní věc, která se objevila v Google, je PageRank, nový vyhledávací algoritmus. Brin a Page se rozhodli, že by se nevyplatilo hledat na internetu jednotlivé dokumenty střídavě na požádání a následně je vydávat v seznamu. Musíte je prozkoumat všechny najednou. Zároveň je důležité vybrat z obecného seznamu ty, které budou pro uživatele nejvýznamnější.
Nejtěžší je najít správné kritérium, které by prokázalo autoritu dokumentu. K tomu autoři vyvinuli speciální vzorec a výslednou hodnotu PR nazvali – PageRank.
Revoluční objev tvůrců Google – výběr kritérií pro posouzení důležitosti dokumentu. Staly se odkazy.
Hlavní věc, která byla v novém algoritmu zohledněna, je, kolikrát jiné zdroje odkazují na dokument. Ten, který je zmiňován nejčastěji, se stává prvním v žebříčku a je uznáván jako nejsměrodatnější. Například když sedm z deseti stránky odkazovat na jednoho, pak je vůdcem on.
V důsledku toho je vybráno několik uzlů, které mají nejvíce odkazů. Vzorec dále zohledňuje, zda naše nalezená „jednička“ zmiňuje nějaké dokumenty. Pokud takové stránky existují, okamžitě stoupají v žebříčku. Odkazy na dokumenty z horní části seznamu vždy váží více než odkazy ze zdrojů níže.
Nakonec uživatel ve výsledcích vyhledávání vidí stránky, které jsou pro něj skutečně užitečné. Nemusí trávit čas analýzou stránek, kde jsou zmíněna klíčová slova – Google to již udělal za něj.
Uživatel nepotřebuje 20 minut nebo hodinu na to, aby si ze seznamu vybral požadovanou stránku. To se stalo jednou z největších výhod Googlu. Tento vyhledávač se bez jakékoliv reklamy okamžitě rozšířil po celém světě, všichni si to poslali a řekli: "No, zkuste to, uvidíte, jak to funguje."
Maxim Poljakov
Jak se Google dostal na vrchol a proč si drží prvenství
Zakladatelé Google vytvořili nejen vyhledávací algoritmus. Rozvinuli architekturu společnosti a přišli s hlavními principy její práce.
Brin a Page zaregistrovali Google v roce 1998 a začali budovat svou budoucnost. korporace v garáži Susan, Brinova přítele. Na tabuli kluci napsali: "Zaměřte se na uživatele." O něco později formulovali poslání společnosti.
Naším cílem je systematizovat všechny informace dostupné ve světě a učinit je dostupnými a pohodlnými pro použití.
Sergey Brin a Larry Page
Pro Google byl od samého začátku prioritou ten, kdo zadává vyhledávací dotaz, a nikoli organizace, které weby vytvořily a čekají na nové zákazníky. Proto se společnost okamžitě rozhodla: reklamní by měly být jasně odděleny od výsledků vyhledávání a člověk by si neměl plést výsledky organického vyhledávání s placenými reklamami. Toto pravidlo přilákalo uživatele a pomohlo zvýšit publikum.
Je to velmi důležité. Lidé přicházejí jen kvůli kvalitnímu vyhledávání. Ne najít relevantní inzerát na železářství, ale najít skutečný obchod, který je teď potřeba.
Maxim Poljakov
Společnost rychle obdržela první investice. Google vstoupil do první desítky nejpopulárnějších internetových zdrojů na začátku roku 2001 a snadno se dostal do páté řady. V roce 2004 projekt přestal být „garážovým“ a vstoupil na burzu. V roce 2006 společnost koupila YouTube a společnost, která vyvinula operační systém Android. Tyto akvizice urychlily růst.
V březnu 2006 se Google dostal na první místo mezi všemi internetovými zdroji. V listopadu 2009 nakrátko prohrál šampionát s Yahoo!, ale v lednu 2010 svou pozici získal zpět a stále zůstává ve vedení.
Dnes má Google pro uživatele několik platforem:
- Algoritmus vyhledávání.
- Služba pro kontextovou reklamu.
- Prohlížeč.
- Operační systém pro chytré telefony.
- Desítky služeb pro běžné uživatele a firmy: pošta, mapy, dokumenty, tabulky a mnoho dalšího.
Důležitým důvodem úspěchu společnosti je firemní kultura.
Brin a Page při výběru nového zaměstnance navrhli provést myšlenkový experiment: představte si, že s touto osobou musíte strávit šest hodin na letišti, protože let byl zpožděn. Jak pohodlný bude?
Vytvořili tak prostředí, ve kterém se lidé k sobě hodí. Bylo to nezbytné pro rozvoj firmy a vznik inovací.
To vše vedlo k tomu, že dnes mezi všemi požadavky uživatelů na vyhledávače tvoří Google 92,21 %. Jedná se o globální monopol.
Co je dobré na "Yandex" - hlavní konkurent společnosti Google v Rusku
Existují pouze dvě země, ve kterých má Google vážné konkurenty a společnost s nimi nemůže nic dělat. Toto je Čína – 68,66 % tamních vyhledávání je na místním portálu Baidu. A Rusko - máme více než 45% žádostí přijatých společností "Yandex".
Tento vyhledávač vytvořili Ilja Segalovič a Arkadij Volozh v roce 1997 – tedy téměř současně s Googlem. Dnes je Yandex webem č. 1 v Rusku.
Stejně jako Google je to platformový systém. Platforma kombinuje několik různých služeb, které pokrývají různé potřeby klienta. Na prvním místě je zde také vyhledávač algoritmus. Je velmi dobrý, ale o jeho fungování není tolik známo jako o algoritmu Google.
Nedávno říkají: "Vůbec nevíme, jak náš algoritmus funguje - to je Matrix Net, naše neuronová síť, pracuje s ní a neustále se zlepšuje." Je známo, že funguje dobře, ale nevíme, z čeho se skládá.
Maxim Poljakov
Kromě vyhledávače má Yandex reklamní platformu a prohlížeč. Plus doplňkové služby: pošta, mapy, disk, market a další. Největší zisk dnes přináší Yandex Taxi a doručovací služby.
Co mění ChatGPT v našem vztahu s vyhledávači
V roce 2023, tedy právě teď, probíhá další revoluce. Google je stále lídrem a nějakou dobu se bude držet na prvním místě, ale co bude dál, nevíme.
Některé věci se v roce 2023 změnily. Objevila se neuronová síť. ChatGPT uvedl do pohybu tak neotřesitelné odvětví, jako je vyhledávání a kontextová reklama.
Maxim Poljakov
V únoru generální ředitel Microsoft Satya Nadella během projevu v kanceláři své společnosti oznámil, že začala nová éra. Celá historie webových technologií je podle něj rozdělena do tří etap:
- Osobní počítač + server.
- Mobilní technologie + cloudové úložiště.
- Umělá inteligence.
Jsme na samém začátku nové, třetí éry. Známé je dokonce i datum zahájení – Satya Nadella to řekl 8. února 2023.
ChatGPT získal milion uživatelů za 5 dní. Jde o nejrychlejší vzestup v historii internetu. Předchozímu lídrovi, Instagramu*, trvalo 75 dní, než dosáhl stejného výsledku.
Neuronová síť je nyní integrována do vyhledávače Bing. Otázka ve vyhledávací liště zní takto: „Zeptejte se mě na cokoli“ nebo „Zeptejte se mě na něco“. ChatGPT odpovídá na složité otázky a dělá to podrobně. Navíc je schopen zvládnout úkoly, které byly dříve použity v Turingův test. Předtím vždy pomáhal odlišit člověka od strojového algoritmu, ale nyní se vše změnilo.
Sergey Brin se vrátil do Googlu po pěti letech prázdnin. Musel se vrátit do práce, protože vznik neuronových sítí ve firmě vyhlásil červenou pohotovost. Google se snaží aktivovat bard - vlastní chatbot. Předpokládá se, že jeho parametry jsou pětkrát větší než schopnosti GPT. Ale tato neuronová síť ještě nebyla plně funkční.
Svět se přehoupl na druhou stranu a Google jako globální monopol pravděpodobně přestane existovat. Ale podívejme se. Jsou možné různé scénáře.
Maxim Poljakov
*Aktivity Meta Platforms Inc. a její sociální sítě Facebook a Instagram jsou na území Ruské federace zakázány.
Přečtěte si také🧐
- 8 vyhledávačů, které jsou lepší než Google
- Kam můžete ChatGPT vložit a proč: 5 možností
- Technologická singularita: je pravda, že technologie se brzy vymkne naší kontrole?