Google gathers triple OpenAI's AI data through its search monopoly
Data Cloudflare zdůrazňují, jak kombinované vyhledávání a indexování AI od Googlu dává Googlu obrovskou datovou výhodu nad OpenAI a Anthropic.
AdGenerální ředitel Cloudflare Matthew Prince tvrdí, že Google těží z neobvykle privilegované úrovně přístupu k webu, což je dáno způsobem, jakým propojuje svůj vyhledávací indexátor se svými systémy pro sběr dat AI.
Prince říká, že interní měření Cloudflare ukazují, že Google aktuálně vidí 3,2krát více stránek než OpenAI. Propast se ještě více prohlubuje u dalších konkurentů: Google zachycuje 4,6krát více obsahu než Microsoft a 4,8krát více než Anthropic nebo Meta. Podle Prince pramení tato nerovnováha z rozhodnutí Googlu spojit svůj vyhledávací indexátor se svým AI indexátorem. Vlastníci stránek nemohou blokovat trénování AI, aniž by se také neztratili z Vyhledávání Google, což vytváří dilema, které Googlu efektivně dává exkluzivní přístup k obrovskému množství dat.
Prince to rámcuje jako zneužití dlouhodobé dominance na trhu a naznačuje, že chování Googlu mu umožňuje rozšířit jeho historický monopol do vznikajícího prostředí AI.
Ad Ad THE DECODER Newsletter Nejdůležitější zprávy z oblasti AI přímo do vaší schránky. ✓ Týdně ✓ Zdarma ✓ Zrušení kdykoli Please leave this field emptyZkontrolujte svou doručenou poštu nebo složku se spamem a potvrďte své odběratelství.
Jak blokování vyhledávání omezuje schopnost vydavatelů blokovat AI scraping
Rozsah nerovnováhy se stává jasnějším, když se podíváme na to, jak agresivně se vlastníci stránek snaží bránit. Od 1. července Cloudflare zablokoval 416 miliard požadavků AI pro své zákazníky. Tyto bloky se týkají hlavně společností, které dodržují standardy nebo identifikují své indexátory odděleně. Google se však této překážce vyhýbá prostřednictvím úzkého propojení svých vyhledávacích a AI systémů.
Vydavatelé čelí binární volbě: povolit, aby se jejich obsah používal k trénování modelů AI od Googlu, nebo ztratit viditelnost ve vyhledávání, což by pro mnohé mohlo být finančně zničující.
Prince řekl pro WIRED, že Google je hlavní překážkou pokroku, pokud není donucen nebo přesvědčen, aby oddělil své vyhledávací a AI indexátory. Bez tohoto rozdělení nemají vydavatelé téměř žádný praktický způsob, jak chránit svůj obsah nebo vyjednávat licenční modely, které budou v éře generativní AI kritické.
Ad Ad Připojte se k naší komunitě Připojte se ke komunitě DECODER na Discordu, Redditu nebo Twitteru – nemůžeme se dočkat, až se s vámi setkáme. Sdílet Přečetli jste si tento měsíc 6 našich článků. Děkujeme za váš zájem! Podpořte naše nezávislé, bezplatné zpravodajství. Každý příspěvek pomáhá a zajišťuje naši budoucnost. Podpořte nyní: Bankovní převod Shrnutí- Data Cloudflare ukazují, že Google přistupuje k 3–5krát více webového obsahu než konkurenti AI jako OpenAI, Anthropic a Microsoft propojením svých vyhledávacích a AI indexátorů.
- Vlastníci webových stránek nemohou blokovat sběr dat AI od Googlu, aniž by se zároveň neztratili z výsledků vyhledávání, což je nutí volit mezi viditelností a kontrolou nad svým obsahem.
- Generální ředitel Cloudflare tvrdí, že tato praxe upevňuje dominanci Googlu a nechává vydavatele neschopné vyjednávat spravedlivé podmínky pro trénování AI, pokud Google neoddělí své indexátory.