Google tvrdí, že Microsoft podvádza – kopíruje výsledky vyhľadávania pre svoj Bing

Celkom zaujímavá situácia nastala na poli internetových vyhľadávačov. Analýza Google ukázala, že Bing má podozrivo podobné výsledky.

Reklama tvorí pre Google asi najväčší zdroj príjmov. Túto reklamu nám užívateľom podsúva nevtieravým a inteligentným spôsobom, pri vyhľadávaní cez hlavnú stránku google.com. Úspech teda priamo závisí od toho, ako veľa budú ľudia službu používať. Dvaja zakladatelia Larry Page a Sergey Brin vytvorili pokrokový algoritmus Page Rank, ktorý robí výsledky skutočne relevantné, pričom sa stále vylepšuje a dopĺňa o nové aspekty. Existuje však aj konkurencia, ktorá môže z tohto reklamného koláča ukrajovať. Kým však konkurencia zaostáva v tom hlavnom – relevantnosti výsledkov, nie je to pre Google až taká hrozba. Čo ak však začnú byť výsledky vyhľadávania iného nástroja podozrivo podobné?

Niečo takéto si v Google začali všímať začiatkom minulého roka na vyhľadávači Bing, ktorý má na starosti Microsoft. Nezvyčajne podobné výsledky v najvyšších miestach (prvých pár najviac relevantných, ktoré sa zobrazia na vrchu stránky) naznačovali, že niečo sa deje na pozadí. Samozrejme, je tu možnosť že algoritmy Microsoftu vyhodnotili relevantnosť podobne ako tie od Google. Je tu ale niekoľko ALE, ktoré prinútili Google na hlbšiu analýzu problému.

Google má, ako už všetci poznáme, schopnosť opraviť, resp. navrhnúť opravu slova, v ktorom sme spravili preklep. V akcii to vyzerá asi takto:

Prvé podozrenia sa objavili vtedy, keď Bing správne našiel požadované výsledky pre zle zadané slovo aj bez toho, aby sa použila nejaká funkcia korekcie. Kým Google preklep užívateľa opravil a vyhľadal podľa správneho slova, Bing vykazoval dobré výsledky hneď, bez toho aby slovo potreboval opraviť.
Uveďme si príklad z článku na serveri SearchEngineLand:


Slovo torsaraphy opravené na tarsorrhaphy v Google, prvá stránka odkaz na Wikipediu

Slovo torsaraphy bez akejkoľvek opravy, ale so správnym hľadaním a rovnakým výsledkom ako má Googlena prvom mieste.

 

Ako vedel Bing, že sa hľadá iné ako zadané slovo, bez korekcie preklepov? Keď sa začali objavovať rovnaké výsledky hľadania na zle zadané slová, prinútilo to inžinierov v Google sledovať situáciu pozornejšie.
Neskôr, asi od októbra 2010, sa začali výsledky z oboch vyhľadávačov na najvyšších miestach oveľa viac  prekrývať ako v minulých mesiacoch. Stáva sa, že Bing má takmer totožné prvé stránky hľadaní, ako Google. Vtedy sa už tušilo, že Microsoft musí nejakým spôsobom „kopírovať“ postupy Google.

Otázka znela, ako by to bolo možné robiť? Microsoft musel sledovať, ako ľudia vyhľadávajú cez Google a tieto informácie potom využívať pre vylepšenie svojho vlastného nástroja Bing. Túto teóriu bolo treba overiť.

Tu Google pristúpil k niečomu, o čom hovorí že nikdy predtým nerobil, a ani v budúcnosti robiť nebude – vedome a schválne upravil hodnotenie stránky tak, aby sa pri hľadaní určitého slova ostala na prvé miesto. Obišiel sa tak celý algoritmus Page Rank. Vytvorilo sa asi 100 „syntetických“ hľadaní, ktoré by v normálnom stave nevyprodukovali žiadne, alebo len minimálne výsledky. Išlo o dlhé zhluky písmen, niečo, čo by bežný užívateľ zadával len málo pravdepodobne. Ku týmto slovám sa potom priradili stránky, ktoré sa dostali na prvé miesto. Išlo o akési „návnady“, žiaden algoritmus nemal dôvod vyhodnotiť ich ako relevantné vzhľadom k vyhľadávaným slovám.

Ak by sa teraz začali objavovať rovnaké výsledky hľadania na Bing, znamenalo by to že ten k tomuto dospel kopírovaním výsledkov Google.

Keďže prvotné podozrenie padlo na to, že Microsoft „špehuje“ užívateľov cez prehliadač Internet Explorer, jeho funkcie a prídavný Bing Toolbar, nakázal asi dvadsiatke svojich vývojárov spraviť testy. Z domácich počítačov v priebehu niekoľkých dní pravidelne hľadali určené slová cez Google, pričom používali Internet Explorer so zapnutou funkciou „Navrhované lokality“ a Bing Toolbar-om. V prípade „špehovania“ cez tieto nástroje by sa mali umelo vytvorené výsledky hľadania neskôr objaviť na prvých miestach aj na vyhľadávači Bing. Pritom neexistovalo žiadne logické spojenie medzi hľadaným slovom a nájdenou stránkou.

Čo sa predpokladalo, to sa aj potvrdilo. Experiment začal 17. Decembra, na konci mesiaca sa už niektoré výsledky začali objavovať aj na Bing-u.
Niekoľko príkladov takýchto zhôd:


Slovo hiybbprqag cez Google


Rovnaký výsledok cez Bing

 


Slovo mbzrxpgjys cez Google


Rovnaký výsledok cez Bing

 

Pred začatím testu by oba vyhľadávače nenašli na tieto slová takmer nič. Potom Google manuálne priradil bez akejkoľvek súvislosti vlastné stránky a o pár dní začal rovnaké výsledky generovať aj Bing. Je zjavné, že sa celkom dobre „priúčal“.

Následné rozhorčenie Google je zrejmé – niekto sa na jeho výsledkoch a algoritmoch iba „zvezie“ a vylepšuje si tým svoj vlastný produkt. Otázka znie – je to nelegálne? Nemá byť prečo. Google o nič neprichádza ani mu nebola spravená žiadna škoda (priama). A čo s tým, že Microsoft sleduje správanie svojich užívateľov na webe? Taktiež to nie je problém, Internet Explorer, funkcia Navrhované lokality aj Bing Toolbar dávajú užívateľovi vedieť, že sa budú odosielať nejaké tie anonymné údaje Microsoftu o tom, ako surfuje. Samozrejme všetko sa dá vypnúť, ale v základnom stave je toto zapnuté.

Jediné čo ostáva je fakt, že takéto funkcie boli nefér a v podstate podvádzaním. Bing zjavne využíva informácie o výsledkoch hľadania z Google ako jednu z mnoho metrík na vytvorenie relevantných výsledkov. V podstate teda ako keby využíval cudzie algoritmy.

Celá kauza je však viac-menej jednoducho vysvetliteľná. Z reakcie Microsoftu sa dá vyčítať takýto odkaz - pre hodnotenie stránok používame mnoho zdrojov a signálov, príznakov. Jedným z nich je aj to, že sa učíme od našich užívateľov.
V tomto učení od užívateľov sú potom samozrejme z časti zahrnuté aj hľadania cez Google. Prístup sledovania činnosti reálnych ľudí je samozrejme celkom účinnou metódou ako vylepšovať schopnosti vyhľadávania. To že sa pri tom použijú aj tie informácie, ktoré si užívateľ nájde cez iný prehliadač, je logickým dôsledkom. Následne sa situácia dá interpretovať aj ako „kopírovanie“, ak chcete.

 

Čo to však znamená pre nás užívateľov? Nie veľa. A ako tak pozerám štatistiky čitateľov PC.sk, takmer nič – Internet Explorer nepoužíva ani nie jedno percento z vás. A tí, čo tak robia, majú stále možnosť vypnúť funkcie, ktoré by odosielali informácie o vašom surfovaní či hľadaní cez Google Microsoftu.  V konečnom dôsledku z tohto len získame. Vyhľadávače, nech už sa vylepšujú akokoľvek, budú vlastne produkovať čím ďalej, tým lepšie výsledky. A to je to, čo požadujeme. Marketingové vojny na pozadí sú však zaujímavou témou na sledovanie.

Komentáre (10)
omega8
To co robil Microsoft od svojich zaciatkov robi aj nadalej. Tak ako sledoval pracovanie a zdrojaky Netscapu pre vytvorenie IE, tak to robi aj teraz s Googlom.
passco
Fail .. radsej keby prisli na nieco genialnejsie nez ma google .. kopirovat a opakovat po druhych si myslim ze je trosku mimo a dost ubohe ..
landrower
nieje to praveze ani mimo ani ubohe. pokial to je legalne. ak si mozem legalne usetrit kopu prace, preco tak neurobit? sice nemam rad MS a uz vobec nie IE a bing priam neznasam, ale nic to nemeni na veci ze sa sikovne vynasli...
faugusztin
Problem s takymto riesenim je, ze vlastne parazituje na vysledkoch ineho prehliadaca. Teraz si predstavme situaciu, ze z nejakeho dovodu ziska Bing vacsinu na vyhladavacom trhu. Dosledkom toho budu horsie vysledky vyhladavania Bingu - pretoze nema na kom parazitovat. Jednoducho postavit svoj vyhladavac tak, ze budem preberat cast vysledkov ineho vyhladavaca je absurdna taktika, ktora sa ti skor ci neskor vypomsti.
passco
Pokial nebudu inovovat a nebudu investovat do novych sposobou( v tomto pripade vyhladavania), tak budu pohlteny konkurenciou .. a toto pravidlo je svate .. Neviem ale ty si v obchode kupis tenisky od pumy alebo presne kopie u cinancov? Teda ja dam radsej prednost tomu originalnemu :)
passco
Pokial nebudu inovovat a nebudu investovat do novych sposobou( v tomto pripade vyhladavania), tak budu pohlteny konkurenciou .. a toto pravidlo je svate .. Neviem ale ty si v obchode kupis tenisky od pumy alebo presne kopie u cinancov? Teda ja dam radsej prednost tomu originalnemu :)
Nameless
"Dobry umelci kopiruju...ale ti najlepsi kradnu" :) Mrkvosoft nemam rad ani celu ich politiku a nesuhlasim s nazorom autora clanku ze to pomoze vyvoju a v konecnom dosledku teda hlavne uzivatelovi, lebo si nemyslim ze to ze rok chlapy z googlu museli analyzovat bing nejak pomoho alebo posunulo vyhladavac googlu niekam dopredu, alebo "kopirovanie" vysledkov vyhladavania niekam posunulo bing (jedine hlbsie tam kde je). Google stale pracuje na svojich vyhladavacich algoritmoch a toto ich bude skor demotivovat a bude ich skor tlacit do sposobu ako zabranit parazitovaniu nez tomu aby isli dalej cestou ktoro isli doteraz
Ondro1
A kto už Bing používa? Nejde v ňom vyhľadať ani slovo s diakritikou a výsledky sú úbohé. To je akoby som pre hľadanie používal výlučne zoznam/seznam.
rado3105
Microsoft vznikol z kradezi a kopirovania druhych napadov. XP z VMS, Dos ukradli, IE okopirovali, .. Sranda ze tito zlodeji stoja za vznikom copyrightu a licencovania softwaru. Preco by si mal niekto kupovat nieco co je ukradnute od ineho. Casy MS sa horsia a horsia, dobre ze tu je Apple, Rim, Google. Buducnost je v mobilnosti a rychlosti a MS nic z toho nemal ani nebude mat. Coskoro bude mobilny software prevysovat stolovy mozno 10x nasobne. Je to le otazka casu. Lebo nastastie su ine firmy ktore maju napady a vyrabaju veci ako: webos, playbook. iOS ktore su prevratove. Narodiel od nekreativnych zlodejov v MS. Este maju stastie ze maju spinavymi praktikami podchytene kancelarie a statne organizacie a urobili kinnect. Inak by boli na tom velmi zle co sa buducnosti tyka. I ked mohli by okopirovat ten kinnect cinaci a predavat ho za polovicu. Aj tak ten original je pomaly a nie moc presny.
AmOK
Amen! (aj ked by sa dalo este hodne doplnit) ;-)
Pridať nový komentár
TOPlist