Bladwijzers voor 6 mei tot 7 mei

Dit zijn mijn verbindingen voor 6 mei tot 7 mei:

  • Content Syndication met gehard JavaScript - kentbrewster.com - Handy-code voor de bouw van Javascript widgets met content uit verschillende bronnen zoals Twitter, Digg, Yahoo Pipes, etc.
  • Wiskundige Atlas: Een toegangspoort tot Wiskunde - "Het Mathematisch Atlas is een verzameling van artikelen over aspecten van de wiskunde op en boven het universitair niveau, maar (meestal) niet op het niveau van het huidige onderzoek Het doel van deze collectie is om het onderwerp te introduceren. gebieden van de moderne wiskunde, om een ​​paar van de mijlpaal resultaten en onderwerpen te beschrijven, en om richting te geven op enkele van de belangrijkste bronnen waar meer informatie te vinden is. Zoals elke goede atlas, proberen we op verschillende manieren om te kijken naar elk gebied presenteren en de relatie met aangrenzende gebieden en deelgebieden laten zien. "
  • Drie redenen waarom Twitter is niet de Index Links U Delen - ReadWriteWeb - stelt dat Twitter zal afhangen van bit.ly via partnerschap of overname aan sentiment en semantische analyse van twitter search en inhoud koppeling behandelen.
  • Tough Love For Microsoft Search - december 2008 bericht van Danny Sullivan van Microsoft en de zoektocht landschap.
  • Annalen van Innovatie: Hoe David verslaat Goliath: Rapportage & Essays: The New Yorker - Malcolm Gladwell, met een verslaggever bij grote op Vivek Ranadive en zijn NJB meisjes basketbalteam, in dienst asymmetrische strategieën om conventioneel sterkere teams te overwinnen, en een bredere blik op de geschiedenis van de opstandige strategieën van David en Goliath, TE Lawrence, George Washington, etc.

Bladwijzers voor 28 april via 29 april

Dit zijn mijn verbindingen voor 28 april via 29 april:

Bladwijzers voor 9 april 8:07-17:53

Dit zijn mijn verbindingen voor 9 april 8:07-17:53:

Bladwijzers voor 27 februari via 28 februari

Dit zijn mijn verbindingen voor 27 februari door middel van 28 februari:

Bladwijzers voor 26 februari 10:39-20:05

Dit zijn mijn verbindingen voor 26 februari 10:39-20:05:

Bladwijzers voor 24 februari via 25 februari

Dit zijn mijn verbindingen voor 24 februari door middel van 25 februari:

De Financiën van Yahoo message board sentiment indicator

Barry Ritholtz wijst op de nieuwe gemeenschap sentiment functie, een deel van de nieuwe voorpagina voor Financiën van Yahoo .

Stock message boards zijn een fascinerende plek om te scannen door van tijd tot tijd, met een mix van op de hoogte, niet geïnformeerd, en soms opzettelijk misleidende berichten. Gemiddeld, het postvolume en de heersende sentiment is waarschijnlijk een goed tegendeel indicator. Een deel van wat voorraad message boards interessant is de enorme omvang van de misleiding en algemene lawaai. Tegelijkertijd zijn er een kleiner aantal boord posters die meer dan blind cheerleading of bashing hun gekozen voorraden bijdragen.

Ik heb enige tijd een tijdje terug te kijken naar het proberen om het proces van het scannen van de Financiën van Yahoo boards voor "hoogte" of anderszins strafbare bericht te automatiseren, maar concludeerde dat het project was de moeite niet waard, tenzij ik werkte voor Yahoo. Een deel van het proces dat ik overwoog zou tot het bepalen van een reputatie waarde voor berichten en medewerkers zijn geweest, mede op basis van historische resultaten en deels gebaseerd op user-generated ratings. De laatste herziening van de financiële message boards voorzien van een eenvoudige rating-systeem, maar wat ik zocht was de mogelijkheid om de ratings te zien van een vertrouwde groep gebruikers, en de mogelijkheid om de posters te waarderen en misschien hun waarschijnlijke context (op lange termijn houder, swing trader of intraday handelaar). Het andere stuk zou zijn geweest voor de uitvoering van een aantal tests achteraf op de diverse sentiment indicatoren om te zien of het had een trading waarde.

Het sentiment indicator wordt gegenereerd door Collective Intellect , die zegt:

Met behulp van gepatenteerde algoritmes, Media IntelligenceTM dienst filters Collective Intellect en rangschikt bloggers en berichten, zodat u alleen de meest geloofwaardige bron van informatie zien - en alleen wanneer het om uw trading strategie relevant.

Ik denk dat het veel gemakkelijker om te gaan met de analyse van de financiële bloggers dan de voorraad message boards en chatrooms. Het zal interessant zijn om een ​​oog op hoe deze nieuwe functie werkt buiten te houden.

Zoekverwijzingen - juli 2006 snapshot


Hier is een kort overzicht van de inkomende zoekmachine verwijzingen voor de afgelopen weken. Vergelijk dit met een ander bericht van vorig jaar op zoekmachine verwijzing aandeel , onlangs verwezen in een post bij Alexa wijzend op de discrepantie tussen de gepubliceerde zoekmachine verkeer rapporten en anekdotische waarnemingen door webmasters.

Ligt het aan mij, of zijn deze kaarten een beetje goofy? Heeft Yahoo echt nog steeds 23% van de search markt? Google is op minder dan de helft van de search markt?

Ik geloof het niet. Elke webmaster zal u vertellen dat Google vertegenwoordigt bijna alle van de zoekmachine verkeer. Yahoo is nergens in de buurt van 23%. Lees net de blogs, hier, hier, hier en hier en op talloze andere blogs.

Reeds op 82% in oktober vorig jaar, Google is toegenomen tot nog meer van de inkomende zoekverkeer (92%) hier, vooral ten koste van de "Andere". In de herfst, het leek alsof die waren meestal diverse Chinese zoekmachines, dus misschien mijn site krijgt niet geïndexeerd of goed gerangschikt er niet meer, of Google is het oppakken van marktaandeel, of beide.

Een deel van de reageerders op de Alexa paal opgemerkt toenemende verkeer van Microsoft / MSN / Live search, waaronder een die kreeg het grootste deel van hun verkeer via MSN Search. Ik ben een beetje verbaasd dat ik niet meer verkeer van Yahoo en Microsoft zoeken hier te zien, maar dat kan ook een functie van wie is waarschijnlijk op zoek naar een bepaald onderwerp zijn.

Zie ook de reacties van Greg Linden over het concurrentievermogen van Yahoo en Microsoft zoeken inspanningen

De Financiën van Yahoo Message Boards upgrade - ugh

Gedropt door de Financiën van Yahoo message boards deze avond om te scannen via opmerkingen. De Yahoo Message Boards zijn rond in dezelfde vorm voor bijna even lang als Yahoo, en voor de laatste paar weken Yahoo is het testen van een nieuw formaat, dat vind ik moeilijk te lezen. Gelukkig was er een link om terug te keren naar de originele versie, en ik denk dat het populair geweest.

Ergens in het weekend, hebben alle Financiën van Yahoo message boards is bijgewerkt naar de nieuwe versie, met geen manier om de oude versie te krijgen.

Dit bericht vangt het gevoel van vele leden:

BELANGRIJK BERICHT VAN YAHOO!
Hallo, ik ben de Project Manager voor de nieuwe Yahoo Message Boards. Ik wilde je even laten weten dat we zullen het toevoegen van nog meer nieuwe functies om de prachtige nieuwe planken volgende week:

1) Vanaf volgende maandag, alle nieuwe berichten automatisch worden vertaald in het Noors. Onze Yahoo Finance development team besloten dat gebruikers zou dit willen, en omdat we niet direct aan gebruikers spreken voor een update van onze website, zullen we veronderstellen dat dit is een zeer gewenste eigenschap. De briljante Stanford Ph.D. 's we ingehuurd om de site bij te werken dacht dat het zou cool zijn! Vanwege disk storage vraagstukken, betreuren wij het dat we niet langer in staat zal zijn om je berichten te bieden in het Engels. Gelieve leren Noors, en laat ons weten hoe het gaat op onze feedback formulier! We lezen elk formulier dat u ons te sturen!

2) Zoals u weet, hebben we onlangs gestopt notering voorraad boord berichten chronologisch, en ging naar een thread-gebaseerd systeem. We hebben het gevoel dat aandelen beleggers niet nodig om duidelijk te zien de laatste berichten in chronologische volgorde, in de loop van de handelsdag, en onze Ph.D. genieën van Stanford denkt u liever te graven door draden om oude berichten op uw aandelen te vinden. Wat nog belangrijker is, later deze maand, zullen we het verwijderen van de data en tijden van alle berichten, en vervolgens in september zijn we van plan om ze allemaal willekeurig door elkaar halen. Wij hopen dat u niet gehinderd door het lezen van 8 jaar oude berichten bij het nemen van investeringsbeslissingen. Maak gebruik van de nuttige feedback formulier om ons te laten weten wat je ervan vindt. We lezen elk een!

3) Zoals u wellicht weet, in de Beta we overgestapt van een eenvoudig en doeltreffend systeem van "bevelen" berichten met een klik, een meer complexe een waarin je waardeert berichten met sterren. Natuurlijk, kunt u alleen het aantal sterren te zien voor het eerste bericht in een thread, maar wij vinden dit is beter, zelfs als niemand het gebruikt. Onze Ph.D. ontwikkelaars ons weten dat "complex" is gelijk aan "beter". Dus volgende maand, zullen we de ster systeem te vervangen door een nieuwe nog complexer is, waarin je handmatig berekenen van de vierkantswortel van hoeveel je van de post op een schaal van 3,4 tot 11, en dan delen door pi. Laat ons weten wat u denkt over het feedback formulier, dat volgende maand alleen vermeldingen in Hexadecimaal zal accepteren. We lezen elk bericht.

Tot slot, alleen maar om u enthousiast te krijgen en te bouwen wat anticipatie, Ik wilde u laten weten dat onze Ph.D. 's werken aan een nieuwe functie voor 2007. Berichten worden automatisch naar trefwoorden worden gescand door onze koele super-complex zoektechnologie Om te bepalen of ze beter geschikt voor een ander stock bord zou zijn, en zo ja, deze automatisch verplaatst. We voelen de lichte ongemak van het hebben van berichten rond bewogen door het systeem zal worden gecompenseerd door hoe cool de technologie!

Groet,
Yahoo Finance Development Team Manager "

De nieuwe versie standaard draad-georiënteerd, heeft een 5-sterren-systeem, en biedt een filter om alleen zeer gewaardeerde berichten, vergelijkbaar met Slashdot bekijken. Dit lijkt het nuttig om mensen die willen populaire onderwerpen te zien zou kunnen zijn. Helaas, het nieuwe prikbord formaat maakt het erg moeilijk om berichten in de tijd volgorde te bekijken. Het hoeft ook niet de oude boodschap nummers, dus mensen die lijsten van "nuttig" berichten bewaard pech, en in het algemeen lijkt het moeilijk maken om oudere berichten te krijgen behalve via search.

Er zijn meestal veel meer lezers / gluurders dan schrijver / posters op een message board. Het bestuur herzieningen lijken gericht op het helpen van de occasionele lezer, maar lijken ook niet populair bij het huidige bestuur gemeenschappen die eigenlijk het genereren van de inhoud. Er is veel mopperen, en ten minste enkele vroege tekenen van migratie naar andere boards, zoals Investors Hub , Raging Bull , Silicon Investor , en Investor Village .

Na wat experimenteren, heb ik vond het een beetje makkelijker te gebruiken na het wijzigen van de voorkeuren oog op "uitgebreid" en "lijst met berichten". Ik vermoed dat de schroefdraad formaat kan uiteindelijk helpen aparte verkeer tussen de buy-and-hold menigte en de korte termijn handelaren, als mensen zich met het nieuwe systeem. In de tussentijd lijkt er een golf van mensen die proberen uit de andere diensten.

Het zal interessant zijn om te zien hoe de overgang werkt. Ik vind de nieuwe indeling meer moeilijk te lezen, en het lijkt impopulair onder de bestaande gemeenschappen te zijn. Aan de andere kant kan de nieuwe message boards formaat makkelijker voor nieuwe mensen om deel te nemen, en nieuwe gemeenschappen kunnen groeien tot de bestaande vervangen.

Er is wat speculatie op Yahoo's bedoeling, dit bericht is representatief :

Het is raadselachtig dat yahoo dit nieuwe systeem zou handhaven, indien er is duidelijk bewijs (van verwaarlozing van de proef-formaat in de laatste weken) dat het niet populair. Ik vermoed dat er een vertrouwde stijl van dwangmiddelen industriële advertentie mgt rijden dingen. Als u de nieuwe indeling gebruikt, wordt u overgehaald / gedwongen tot het spelen van een soort van tiener interactieve populariteit contest, zoals stemmen voor popsterren. Ik neem aan dat dit is om adverteerders te overtuigen dat het systeem ganzen up gebruiker enthousiasme. Het probleem is, zoals in de consumentenelektronica mkting, de "draden" voorselecteren wat je kunt zien en beantwoorden, channeling je tav de manier waarop berichtgeving en advertenties voorselecteren de werkelijkheid die je kunt zien. In feite, yahoo is onderdeel van een grotere industriële paradigma waarin het leven is een consument besluit-boom in plaats van een spel van nieuwsgierigheid en discussie / analyse. Een deel van de frustratie gevoeld is dat je weet dat je een muis in een doolhof. Je wordt gevangen in een teenie bopper fan tijdschrift rating "producten" in plaats van het delen van ideeën. Het is een schande om zo'n handig forum verlamd door kinderachtige reclame bedrog zien.

Ik ben minder cynisch over de bedoeling van een verhuizing naar een threaded view, maar het is duidelijk een ongemakkelijk verandering voor veel deelnemers die meer daar bezig zijn dan ikzelf. De uitdaging voor Yahoo is dat veel van de waarde in de Finance boards is dat er genoeg verkeer en / of nuttige berichten op veel van hen (AAPL, GOOG, TIE, meest verhandelde aandelen) te maken het de moeite waard om van tijd tot tijd , maar de belangen van de actieve raad gemeenschap zijn anders dan die van een toevallige toeschouwer, en voor het moment is er een discrepantie in progress. Yahoo kan ook hebben opgepikt een ongelegen weekend om over te schakelen, omdat het plaatsen van volume is waarschijnlijk hoog in de komende dagen, reageren op gebeurtenissen in het Midden-Oosten.

Ik was onlangs wees op Instant Bull , een nieuwe site bedoeld om meerdere financiën boards scannen. Helaas wil Firefox 1.5, en ik ben nog steeds actief 1.x voor nu, dus ik zal moeten het later nog eens.

Werk 2006/07/16 23:00 PDT: Meer van PaidContent , GigaOm , CNet

Werk 2006/07/18 19:45 PDT: Er is een indrukwekkend niveau van antipathie tegen het nieuwe prikbord formaat. Yahoo Finance leden hebben snel begonnen met het opzetten bruggenhoofden op andere sites. Een anekdote uit de YHOO bord :

ELN op Investor Village blijkt dat meer dan 800 leden en meer dan 1800 gasten (waarschijnlijk mensen controleren van alternatieve planken) in de laatste 24 uur hebben bezocht! Wie zelfs gehoord van Investor Village voordat deze week?

Ik deed een onderzoek van berichten op Yahoo's ELN boord en zag dat er bijna 500 postings tussen 06:00 gisteren en 06:00 vandaag (om wat voor reden, is Yahoo's zoek functie toont geen resultaten voor postings na 06:00 vandaag), waarvan de meeste waren waarschijnlijk gerelateerd klachten over het nieuwe formaat. Toen deed ik een zoekopdracht op het aantal postings gedaan sinds 06:00 vandaag op het ELN bord op Investor Village en er is al meer dan 400 berichten! Gezien ze hebben slechts 1.805 posten in totaal op het bord en gezien het aantal mensen dat de ELN bord hebt bezocht op Investor Village in de laatste 24 uur, vertelt het me als Yahoo een manier om iets wat lijkt op het terug te brengen niet vinden oude formaat en de klagers op Yahoo te zien dat hun klachten ze nergens krijgen, er komt wel een massale uittocht van al die mensen die nu het plaatsen op of in ieder geval het controleren van Investor Village.

Deze 'upgrade' implementaion is een ramp geweest. Concurrenten als Investor Village zijn te profiteren. Zelfs als Yahoo krijgt een deel van hun verkeer terug, zullen ze niet alles te herstellen, net als Coke niet al hun marktaandeel te winnen na de New Coke fiasco. Als dit een indicatie van Yahoo's huidige business model, wil je echt aan een belegger in deze voorraad als toekomst 'upgrades' worden uitgevoerd??

Overblijfselen van het "oude" systeem zijn nog steeds rond in de niet-Finance afdelingen van Yahoo, zodat anderen hebben geprobeerd om er opgezet winkel, zoals dit alternatief AAPL raad. ik vermoed deze kunnen niet lang duren.

Tom Foremski heeft gereageerd op de ophef over de nieuwe indeling prikbord in de context van user interface design: "mensen zijn gewoontedieren en niemand wil te hebben om een nieuwe gebruikersinterface te leren". Ik ben het eens, maar ik denk dat er meer aan de hand dan mensen die niet willen veranderen. Persoonlijk vind ik de nieuwe indeling moeilijk om visueel te scannen, en achteraf zie ik dat ik de neiging om te kijken naar de interactie tussen bepaalde individuele medewerkers, maar ook voor algemene geluidsniveau rond verschillende onderwerpen. Het nieuwe systeem zou waarschijnlijk goed werken voor plaatselijk gedreven forums, terwijl veel van de hoog volume forums grenzen aan IRC chat.

Message boards are pre-Web 1.0 social software, dating back to the days of dialup BBSes. One view might be that the users just don't “get” the Web 2.0 fit and finish being wrapped around Yahoo Finance. However, I think the clash here has mostly been about a mismatch between the existing community of users and the use of the site as envisioned by the Yahoo Finance product management team.

I conclude that there's either a serious gap in how the user testing and feedback process worked, or there's been a conscious management decision to change the character of the Finance Boards product, to clean up the content and make it better behaved by making it less interactive. Historically, many of the posts are of questionable merit, laced with profanity, innuendo, misrepresentation, and other disinformation. However…if you knew that already, then the flow of the pumper/basher posts itself was a useful data point, along with posts from individual traders and investors offering up independent opinions. Looks like that's another bit of history now.

YHOO shares dropped hard in after hours trading today, the latest earnings matched , but search monetization isn't growing well. Ironically, it sounds like at least a few traders shorted YHOO at the close, out of a combination of spite and a sense of management distrust following the message board fiasco. Not a sound rationale for the trade, but it clearly worked out for them.

Update 07-20-2006 14:36PDT – Yahoo has added a link to the old message list view, labeled “view all messages”, next to “view all topics”. The individual posts are still formatted in the “new look” though.

I'm really curious about what effect this is having on traffic and monetization at Yahoo Finance. I recognize a number of user handles that have moved to Investor Village or Investors Hub, and there are daily notices there from the site operators on server upgrades and other steps to accomodate the unexpected boost in traffic.

Some of you may also be interested in checking out SaneBull , an example of an AJAX-based stock info scanner. via TechCrunch

Google Finance launches

Google lanceerde Google Finance vandaag. Lots of people have written about it already , generally nonplussed. Here's my quick reaction.

I like:

  • News events plotted on the stock chart timeline. I wish they'd add this to Yahoo Finance.
  • Ajax UI voor het scrollen de grafiek voorraad rond en het tijdvenster veranderende
  • Recente blog zoekresultaten op de rechter zijbalk (hoewel ze lijken een paar uur achter zijn)

Ik wens:

  • More charting features. There basically aren't any right now.
  • Betere integratie van de "Meer bronnen" features. Dingen zoals SEC-dossiers, institutionele houders, en het verdienen van schattingen worden allemaal geleverd door 3 partijen via uitgaande links, waardoor het moeilijk om door te spiegelen.

Technische grafieken en onderzoeksrapporten worden verstrekt via Yahoo Finance, hoewel de discussies worden gehost op Google Groups.

De eigenschap die ik zou echt graag zien is een intelligent gefilterde weergave van de Financiën van Yahoo discussieborden. There is some interesting and useful information there, but a far larger quantity of rants, spam, and trolling in between.

PRASE – PageRank assisted search engine – compare ranking on Google, Yahoo, and MSN

page rank assisted search engine
PRASE , aka “Prase” is a new web tool for examining the PageRank assigned to top search results at Google, Yahoo, and MSN Search. Search terms are entered in the usual way, but a combined list of results from the three search engines is presented in PageRank order, from highest to lowest, along with the search engine and result rank.

I tried a few search queries, such as “web 2.0″, “palo alto”, “search algorithm”, “martin luther king”, and was surprised to see how quickly the PageRank 0 pages start turning up in the search results. For “web 2.0″, the top result on Yahoo is the Wikipedia entry on Web 2.0, which seems reasonable, but it's also a PR0 page, which is surprising to me.

As a further experiment, I tried a few keywords from this list of top paying search terms , with generally similar results.

PageRank is only used by Google, which no longer uses the original PageRank algorithm for ranking results, but it's still interesting to see the top search results from the three major search engines laid out with PR scores to get some sense of the page linkage.

Zie ook:

Watching 4th graders use search engines

Afgelopen vrijdag heb ik een uur met mijn dochter's 4e klas, om ze te doen online onderzoek van de verslagen over de vroege Californië ontdekkingsreizigers. Ze werden individueel toegewezen een ontdekkingsreiziger, en waren op zoek naar elementaire biografische informatie zoals datum en plaats van geboorte en dood, en opmerkelijke historische prestaties of andere interessante onderwerpen om over te schrijven. Vanuit mijn perspectief, dit bleek een soort van kleine focusgroep over het gebruik van zoekmachines.

Ik breng het grootste deel van mijn tijd rond mensen die zijn vrij goed in het gebruik van zoekmachines en online research tools, dus het was interessant om te zien wat ze zouden doen met deze opdracht.

De kinderen zijn allemaal bekend met computers in verschillende mate. Zij hebben de contactmomenten gehad met behulp van de computer minstens een keer per week sinds de kleuterschool, en de meeste van hen hebben enige ervaring met behulp van computers thuis (dit is Palo Alto, na alle). Ik denk niet dat ze een georganiseerde "internet onderzoek" op school up gedaan op dit punt, dat wel.

Ze begon allemaal met de naam van hun onderzoek onderwerp geschreven op een stuk papier en had ongeveer 20 minuten om een ​​aantal nuttige informatie te vinden.

Hier zijn enkele opmerkingen:

  • Simpelweg te typen in de namen van de ontdekkingsreizigers was een uitdaging voor velen van hen ("Joseph Joaquin Moraga", "Ivan Aleksandrovitsj Kuskov", en anderen die ik kan me niet herinneren).
  • Zij hebben vaak geprobeerd om de zoekterm te typen in de adresbalk. Ik zag ook ten minste een persoon proberen om de zoekterm typt in een vorm invoerveld in een advertentie.
  • Hun standaard startpagina is ingesteld op Yahooligans!, Dat is kindvriendelijk, maar lijkt de zoekresultaten sterk beperken. Ik had de kinderen proberen hun vragen eerst daar, maar de meeste van hen nul zoekresultaten geretourneerd.
  • Ik laat de kinderen kiezen welke zoekmachine ze wilden gebruiken. Ongeveer een derde van de kinderen vrijwillig een voorkeur voor het gebruik van Google, het grootste deel van de rest wist niet of zorg (ik stuurde ongeveer de helft aan Yahoo en half aan Google), en een kind wilde echt A9 (vreemde gebruiken, heb ik 't hebben een kans om uit te vinden waarom).
  • Geen van de kinderen waren vertrouwd met het gebruik van aanhalingstekens om exacte zin matching opgeven. Sommige van de namen van de ontdekkingsreizigers 'bevatten vaak voorkomende componenten en terug een groot aantal irrelevante resultaten zonder aanhalingstekens.
  • Geen van de kinderen waren vertrouwd met de geavanceerde search operators voor het uitsluiten of een kwalificerend zoekresultaten. Ik had om te helpen in een paar gevallen waarin zij hadden moeite het vinden van relevante pagina's.
  • Sommigen van hen niet begrijpen het verschil tussen pagina-inhoud en de advertenties in de kopteksten, voetteksten en sidebars.
  • Sommigen van hen waren al beiden bekend met Wikipedia en het voordeel en probleem dat iedereen de pagina kunt wijzigen. Een persoon wilde uitsluitend kijken op Wikipedia nadat het onderwerp kwam.
  • Het ontbreken van een bookmarking systeem voor de studenten om te gebruiken heeft de neiging om hen te dwingen om uit te printen pagina's die ze later wilt gebruiken. Dit is niet geweldig op een school lab, aangezien de inhoud is semi-disposable en ze zijn meestal scrounging naar printer verbruiksartikelen zoals toner en papier te besparen. De kinderen vonden het hebben van iets terug te nemen naar de klas met hen, hoewel
  • De variaties in de spelling voor de veelal Spaanse namen veroorzaakt problemen voor sommige queries. Google's "bedoel je" suggesties waren behulpzaam. Ten minste een query (die ik niet kan herinneren) bestond volledig uit gemeenschappelijke Spaanse namen, die een aantal beroemde mensen anders dan de bedoelde vraag onderwerp geëvenaard. Dit is vergelijkbaar met het probleem van het zoeken op gemeenschappelijke Aziatische namen ( zoals de mijne ).
  • Sommige studenten snel geklikt zich in een rathole van volledig los pagina's, meestal na het klikken op een advertentie.

Kijken naar de kinderen proberen te vinden nuttige pagina's benadrukt de verschillen met mijn gebruikelijke zoekgedrag, dat is om snel de pagina met zoekresultaten, dan verfijnen van de query met behulp van extra trefwoorden en / of zoeken exploitanten, die beide zijn moeilijk voor 9 - en 10 -jarigen te doen. In de "Zoekmethode" Ik meestal open resultaten in een nieuw browser tab of venster. De kinderen daadwerkelijk doorklikken op de link, waardoor het moeilijk om te werken door middel van een lijst van kandidaat-resultaten.

Toevallig, eerder deze week kwam ik een post op Google Blogoscoped wat wijst op een recent proefschrift over search user interface design gericht op kinderen , door Hilary Browne Hutchinson aan de Universiteit van Maryland, die een aantal interessante observaties en ideeën heeft.

How (and where) to download your del.icio.us bookmarks

Last Friday's announcement that Yahoo is buying del.icio.us has probably got more than a few people thinking about the future of the service and whether they want to keep using it. In any case, as with all of the interesting and useful web services out there, it's good to take time now and then to back up your personal data, in case something goes sideways and the service becomes unavailable or unusable for whatever reason.

I'm personally planning on continuing to use del.icio.us, although there are a number of interesting tagged bookmarking alternatives out there, including running your own.

The first step is to get your personal bookmark data, which can be obtained through the del.icio.us API. You can retrieve all your saved bookmarks at del.icio.us/api/posts/all , which will return an XML file that can be saved to your local system and used as a backup or to import your bookmarks into another web application elsewhere.

The next step is to decide what you want to do with the data. Some alternative tagged bookmarking solutions include:

The following services are based on open source projects, so you can (or in some cases have to) run your own bookmarking system.

Yahoo already runs MyWeb2.0 , which presumably will begin to merge with del.icio.us at some point. It has a lot of interesting features, but hasn't had enough to get me to switch over up to this point. I've been wanting private bookmarks and tags on del.icio.us for a while, although I think I'll be moving those off my desktop onto a roll-your-own server solution.

Any more suggestions? Reply in the comments and I'll pull them up to the main post.

Here's an extensive list of free bookmark managers at lights.com (via David Beisel )

Newsweek on white hat and black hat search engine optimization

via SEOmoz :

Deze week Newsweek (12 december 2005) heeft een artikel over witte hoed vs zwarte hoed zoekmachine optimalisatie . Onder andere dingen, het is interessant dat het onderwerp het is gemaakt in de mainstream media.

Een "black hat" anekdote:

Met behulp van een illegale software programma dat hij gedownload van het net, dat hij onder dwang geïnjecteerd een link naar zijn eigen prive-detectives verwijzende site op de site van de Stony Brook University Long Island. De meeste zoekmachines geven een hogere waarde om een ​​link op een gerenommeerde universiteit plaats.

De site in kwestie lijkt te zijn "www.private-detectives.org", momenteel nog # 1 op MSN en # 4 bij Yahoo voor zoekopdrachten op "prive-detectives". Het lijkt te zijn zandbak op Google.

Een ander interessant bericht op SEOmoz kenmerkt commentaren van "randfish" en "Earlgrey", de twee SEO consultants geïnterviewd door Newsweek over de gegrondheid van de "White Hat" vs "Black Hat" zoekmachine optimalisatie, en geeft verder perspectief op de motivatie en de vooruitzichten van de twee benaderingen.

In sommige opzichten kan men denken aan het verschil tussen zoekmachine optimalisatie benaderingen als een "trading"-benadering versus een "gebouw" benadering van investeringen. De "Black Hat"-aanpak verwoord in de SEOmoz artikel neiging om puur richten op een tactisch moment geld uit te keren aan de exploitant, terwijl de "White Hat"-benadering gaat ervan uit dat de exploitant lopende toekomstige waarde zal realiseren door het ontwikkelen van een bruikbare informatie actief en maakt het zichtbaar voor de zoekmachines. Dit maakt een impliciete veronderstelling dat de site zelf biedt een aantal unieke en waardevolle informatie-inhoud, die meestal niet het geval kan zijn op de lange termijn.

Van een information retrieval oogpunt, ik ben uiteraard in het laatste kamp te denken dat het identificeren van de meest relevante resultaten voor de zoekopdracht gebruiker is een goede zaak. Echter, de zwarte hoed aanpak is volkomen logisch als je bedenkt in termen van het optimaliseren van de op korte termijn waarde terug naar de uitgever (cash als informatie), terwijl eventueel nog de presentatie van een bruikbare informatie Terug naar de gebruiker. Dit is vooral het geval voor commodity-informatie of producten, waarin de actuele informatie of goederen zijn identiek, zoals affiliate sales.

Ik ben een beetje nieuwsgierig naar de link van Stony Brook University. Ik nam een ​​snelle blik, maar was niet in staat zich te wenden tot een backlink. Een van de problemen met louter baseren op betrouwbare koppeling bronnen is dat ze kunnen worden gamed, beschadigd of gehackt.

Zie ook: Een literatuurlijst op PageRank en zoekalgoritmen

Werk 12-12-2005 00:30 PST: Veel reacties op Matt Cutt's post , plus Slashdot

Yahoo gaat na meer tagging activa, koopt del.icio.us

Yahoo gaat verder naar beneden het pad van meer tagging en meer op samenwerking gerichte content. Na al gekocht Flickr, vanmorgen ze verwerven del.icio.us (termen undislosed):

Van Joshua Schachter op de del.icio.us blog :

We're proud to announce that del.icio.us has joined the Yahoo! family. Together we'll continue to improve how people discover, remember and share on the Internet, with a big emphasis on the power of community. We're excited to be working with the Yahoo! Search team – they definitely get social systems and their potential to change the web. (We're also excited to be joining our fraternal twin Flickr!)

From Jeremy Zawodny at Yahoo Search Blog :

And just like we've done with Flickr, we plan to give del.icio.us the resources, support, and room it needs to continue growing the service and community. Finally, don't be surprised if you see My Web and del.icio.us borrow a few ideas from each other in the future.

From Lisa McMillan, an enthusiastic user of all 3 services (comment on the del.icio.us blog):

Yahoo that's delicious! I live here. I live in flickr. I live at yahoo. This is insane. You deserve this success dude. Just please gd don't let me lose my bookmarks :-D I'm practically my own search engine. LOL

Tagged bookmarking sites such as del.icio.us can provide a rich source of input data for developing contextual and topical search. The early adopters that have used del.icio.us up to this point are unlikely to bookmark spam or very uninteresting pages, and the aggregate set of bookmarks and tags is likely to expose clustering of links and related tags which can be used to refine search results by improving estimates of user intent. Individuals are becoming their own search engine in a very personal, narrow way, which could be coupled to general purpose search engines such as Yahoo or Google.

I think Google needs to identify resources it can use to incorporate more user feedback into search results. Looking over the users' shoulders via AdSense is interesting but inadequate on its own because there are a lot of sites that will never be AdSense publishers. Explicit input capturing the user's intent, whether through tagging, voting, posting, publishing, is a strong indication of relevance and interest by that user. I think the basic Google philosophy of letting the algorithm do everything is much more scalable, but it looks like time to capture more human input into the algorithms.

In a recent post , I pointed out some work at Yahoo on computing conditional search ranking based on user intent. The range of topics on del.icio.us tends to be predictably biased, but for the areas that it covers well, I'd be looking for some opportunities to improve search results based on what humans thought was interesting. As far as I know, Google doesn't have any assets in this space. Maybe Blogger or Orkut, but those are very noisy inputs.

This seems like a great move by Yahoo on multiple fronts, and I am very interested to see how this plays out.

Zie ook:

Werk 12-12-2005 00:30 PST: geen harde cijfers, maar iets als $ 10-15MM met earn-outs lijkt plausibel. Meer berichten, analyses en commentaren van de lezer: Om Malik , John Batelle , Paul Kedrosky .

Personalisatie, Intent en wijzigen PageRank berekeningen

Greg Linden nam een kijkje op Langville en Meyer's dieper in PageRank , een van de papieren op mijn PageRank lijst korte lezing en is op zoek naar een aantal van dezelfde gebieden Ik heb nagedacht over.

Op de waarschijnlijkheid van de overgang over een link in de link grafiek, bijvoorbeeld van het papier op pagina's 338 veronderstelt dat surfers zijn even geneigd om te klikken op de koppelingen overal in de pagina, duidelijk een twijfelachtige aanname. Echter, aan het eind van die pagina, zij het kort stellen dat "elke geschikte kansverdeling" kan worden gebruikt in plaats waaronder een afgeleid van "het gebruik van internet logs".

Evenzo, paragraaf 6.2 beschrijft de personalisatie vector - de waarschijnlijkheid van het springen naar een niet-verbonden pagina in de grafiek in plaats van het volgen van een schakel - en kort suggereert dat dit personalisatie vector kan worden bepaald op basis van het werkelijke gebruik van gegevens.

In feite, althans naar mijn lezen, het papier lijkt te impliceren dat het ideaal is voor beide zou zijn - de kans op een koppeling te volgen en de personalisatie vector de waarschijnlijkheid van het springen naar een pagina - te worden gebaseerd op feitelijke dataverbruik. Ze lijken te suggereren dat dit een PageRank dat de beste schatting van de zoeker belang in een pagina zou zijn zou opleveren.

Enkele gedachten:

1. The goal of the search ranking is to identify the most relevant results for the input query. Putting aside the question of scaling for a moment, it seems like there are good opportunities to incorporate information about intent, context, and reputation through the transition and personalization vector. We don't actually care about the “PageRank” per se, but rather about getting the relevant result in front of the user. A hazard in using popularity alone (traffic data on actual clicked links) is it creates a fast positive feedback loop which may only reflect what's well publicized rather than relevant. Technorati is particularly prone to this effect, since people click on the top queries just to see what they are about. Another example is that the Langville and Meyer paper is quite good, but references to it are buried deep in the search results page for “PageRank”. So…I think we can make good use of actual usage data, but only some applications (such as “buzz trackers”) can rely on usage data only (or mostly). A conditional or personalized ranking would be expensive to compute on a global basis, but might also give useful results if it were applied on a significantly reduced set of relevant pages.

2. In een reputatie-en contextgevoelige search applicatie, kan de untraversed uitgaande links nog steeds helpen aangeven wat "buurt" van de informatie is mogelijk gerelateerd aan de opgegeven pagina. Ik weet niet hoeveel van dit is eigenlijk al in gebruik. Ik heb het zien van grote hoeveelheden inkomende spam in reacties met wartaal links naar werkelijke bedrijven (Apple, Macromedia, BBC, ABC News), die veel niet logisch tenzij de spammers denken dat het zal helpen de inhoud "ruiken beter". Zonder links naar "mainstream inhoud", de spaminhoud detecteerbaar is door meestal koppelen aan andere bekende spam inhoud, die de neiging niet te worden gekoppeld aan door echte pagina's.

3. Als u veronderstellen dat de gebruiker wat zoeken opzet rijden hun keuze links te volgen, kan het mogelijk zijn om een ​​voorwaardelijke verdeling van paginawissels plaats van uniform willekeurig te bouwen. Langs deze lijnen, kwam ik een demo ("Mindset") en papier van Yahoo op een filter voor het aangeven van de voorkeur voor "commerciële" versus "niet-commerciële" zoekresultaten. Ik denk dat het misschien praktisch zijn om te bouwen veel kleinere collecties van thema-domein-specifieke pagina's, met thema-specifieke ranking, en vallen terug naar de algemene ranking model voor extra zoekresultaten.

4. Ik denk dat de zoekmachines zijn het veranderen van het verwachte gedrag van de gebruikers in de tijd, waardoor de uniforme willekeurige aanname nog meer gebroken. Wanneer gebruikers putten hun interesse in een bepaald pad naar een link, ze waarschijnlijk om naar een persoonlijk-bekende URL, of zoek opnieuw en ga naar een ander lokaal aangestuurde zoekresultaat. Dit moet de distributie verder scheef in het voordeel van een voorwaardelijke ranking model, in plaats van gewoon een willekeurig iemand.

Het bouwen van betere search, het filteren van spam blogs

Batelle's Searchblog noemt een artikel van Raul Valdes-Perez van Vivisimo citeren 5 redenen waarom zoeken personalisatie niet goed zal werken. Parafraseren zijn lijst:

  1. Gebruikers belangen van de individuele / zoekplan veranderingen in de tijd
  2. De klik en het bekijken van gegevens beschikbaar om de personalisatie doen is beperkt
  3. Afleiden gebruiker intentie van bekeken pagina na zoekopdracht kan misleidend zijn, omdat de klik wordt aangedreven door een snippet in de zoekresultaten, niet de hele pagina
  4. Computers worden vaak gedeeld door meerdere gebruikers met verschillende bedoelingen
  5. Queries zijn te kort om nauwkeurig af te leiden bedoeling

Vivismo (Clusty) is het nemen van een benadering waarbij groepen van de zoekresultaten bij elkaar geclusterd en gepresenteerd aan de gebruiker voor verdere exploratie. Het idee is om de gebruiker expliciet richt de zoektocht naar resultaten die zij relevant vinden, en ik heb gevonden het kan heel goed werken voor het blootleggen van groepen van zoekresultaten die ik anders misschien over het hoofd.

There are two ways I can think to explain this:

1. People who use Google are more likely to be searching for content that's on my site.
2. The market share numbers are wrong. Google actually generates more traffic than has been reported and MSN and AOL have been over-estimated.

I suspect that #1 is closer to reality. After all, I most often write about topics that are of interest to an audience that's more technical than average. And I suspect that crowd skews toward Google in a more dramatic fashion than the general population of Internet users. If that's true, it would seem to confirm many of the stereotypes about AOL and MSN users.

It looks like my site has even less appeal for a consumer audience than his…

2 Pagina 1 van 2 1 2