Videó: El Chombo - Dame Tu Cosita feat. Cutty Ranks (Official Video) [Ultra Music] (November 2024)
Híreim megismerése érdekében gyakran átkutatom a Google Híreket, amelyek a világ minden tájáról származó cikkeket aggregálnak annak alapján, amit a „robot” meghatározott. Arról szól, hogy mi a trend. Általában hiányzik a hírekről, és teljesen figyelmen kívül hagyja a fontos kommentárokat, mint például az oszlopomat. Ehelyett úgy tűnik, hogy inkább a halott linkeket kívánja elérni - ezzel értem a Wall Street Journal-ot , amelynek előfizetéséhez az olvasáshoz szükség van.
A mai eset erre utal. A CES híres története volt arról, hogy a Dish Network ajánlatot tett Clearwire vásárlására. Ahelyett, hogy az elérhető és olvasható weboldalak bármelyik kapcsolódó történetéhez kapcsolódna, a Google úgy dönt, hogy a legfontosabb történetnek a Wall Street Journal- ból kell származnia.
A múltban a Google-nak valamilyen üzlete volt, amely lehetővé tette a felhasználók számára, hogy legalább olvassa el a bevezető bekezdést vagy akár az egész cikket, még mielőtt a paywall blokkolja. Ha nem ismeri a bypass-trükköt (alább tárgyaljuk), ez már nem vonatkozik. Most befut a fizetősávba, és kész. Gondolom, hogy a tényleges előfizetők túljutnak ezen, de kíváncsi vagyok, hogy a Google botjai hogyan jutnak el ahhoz, hogy először megtalálják a történetet. Fizet a Google? Kétlem. Tehát van valamiféle hátsó ajtó a Google robotok számára, igaz?
Ez hamis, és szolgálatot okoz a Google felhasználók számára. A Google ezen a problémán megy keresztül, hogy legyőzze az embereket, akik megpróbálják a játékot játszani, de ez lehetővé teszi, hogy a Wall Street Journal húzza ezt a mutatványt? Ez lényegében fizetett a Wall Street Journal előfizetéseiért. Ezt akarja a Google? Megkapja-e a Google a fizetést?
A Google számára nem lehet ilyen nehéz ezt a bosszúságot egyszerűen kijavítani. Egy percig tart - öt felső. Ez túl sok munka?
Ha egy vállalatnak be van építve a fizetési fal, a Google-nak egyáltalán nem kell keresnie a webhelyen. A robotoknak tudniuk kell, hogy létezik fizetőfal, és el kell kerülniük a keresést. És igen, magyarázatot szeretnék kapni arra vonatkozóan, hogy a robotok pontosan hogyan tudnak keresni egy olyan oldalon, amelyet egy paywall blokkol. Ez egy rejtély.
A fizetőfalnak pontosan meg kell egyeznie a „robots.txt” -kel, amely azt mondja, hogy a robot a robotot távozza-e. De valami gyenge a WSJ és a Google kapcsolatán. Az összes bot megölésének legegyszerűbb módja a metacímke a robots.txt fájlban, tehát: .
A WSJ ehelyett kifejezetten blokkolja az egyes alkönyvtárakat, de látszólag nem mindegyiket. És még furcsább is, ha a Google Hírekben pontosan ugyanazt a cikket keresi, és nem pusztán rákattint a lepusztult linkre, akkor a cikket más mechanizmuson keresztül juttatja el.
Felhívom a technikai olvasókat, hogy kiderítsék, mi történik ezekkel a kettővel, a WSJ által használt robots.txt fájl megvizsgálásával. Nyilvános dokumentum érhető el itt.
Akárhogy is is van, a webhelyeknek pénzügyi okokból kifizető falai vannak. Ha egy játékkal szeretnének játszani tartalmukkal, ez egy dolog, de a keresési eredmények között azt is meg kell tiltani, ahogy a Google megpróbálja megtéveszteni az embereket, akik megpróbálják a játékot játszani. A Google vázlatos viselkedés miatt megtiltja a szerencsétlen bloggert a kalap leejtésekor. Mi lenne, ha ugyanúgy kezelnék a nagyobb webhelyeket?
Követheti John C. Dvorak-ot a Twitteren @therealdvorak.
Több John C. Dvorak:
Forduljon a témához John C. Dvorakkal.
MEGJEGYZNI AZ összes képet a galériában