Sök Dämpning och Rollyo

"Sök dämpning" är ett nytt begrepp för mig, men verkar vara en bra beskrivning av processen med filtrering feeds och sökresultat till en hanterbar storlek. Som mer innehåll blir tillgängligt i RSS, tenderar jag att prenumerera på något som verkar intressant, men jag letar efter förbättrade metoder för sökning och filtrering av innehåll i den uppsättningen.

Komma ikapp lite på flödesaggregator, ser jag en artikel på O'Reilly om Rollyo , en ny "Rulla din egen sökmotor" webbplats från Dave Pell i Davenetics .

Rollyo är den senaste sinnet varp från Dave Pell. Rollyo ger någon möjlighet att rulla sina egna Yahoo!-drivna sökmotor, dämpning av resultat till en uppsättning av upp till 25 platser. Och medan searchrolls (som de kallas) som du skapar är kring ett visst ämne (t.ex. mat och matsal), de är också knuten till en verklig person (till exempel mat och restauranger är av Jason Kottke). Resultatet är ett ämne-specifik sökning skapas och underhålls av en betrodd källa.
...
Rolly s Utgångspunkten är en jag har predikat för sent: dämpning är nästa aggregering ...

Nyligen, jag har tittat på detta från en närstående vinkel, vilket är hur man kan sluta sig till aktuell relevans bland människor eller tillförlitliga källor bygger på länkar, taggning, och söka, och namngav enhet upptäckt. Människor är redan länkning, taggning, och söka, så vissa uppgifter finns som en biprodukt av arbete som de redan gör. Å andra sidan, om tillräckligt många människor du litar tar ytterligare steg för uttryckligen förklara de källor som de tycker är relevanta, det skulle hjälpa mycket.

Se även Memeorandum , Findory , personliga Bee .

Mer om detta från Techcrunch

Patchning Refeed för PHP-CGI

Om du inte är intresserad av Reblog , Refeed eller PHP-CGI, rekommenderar jag att du hoppar över det här inlägget.

På senare tid har jag jobbat med olika kombinationer av sammanställare, taggning, ranking, och presentationssystem. Här är några korrigeringar för alla som försöker få Reblog / Refeed 1.3 körs på en värd webbtjänst.

Jag är mestadels använder Dreamhost, som för närvarande är igång PHP 4.3.10, och erbjuder ett urval av PHP som en Apache-modul eller PHP-CGI. Dessa installationsproblem kan förekomma för alla som kör Refeed i ett PHP-CGI miljö. De första symptomen är att dialogrutan HTTP-verifiering kommer att dyka upp när du försöker visa Refeed kontrollpanel, oberoende av om referenser definieras i init.php.

De viktigaste frågorna:

  • Refeed installeras och körs som förpackade, men bara om det körs som en Apache-modul. Det här är ett säkerhetsproblem i en delad hosting miljö
  • Säkerhetsproblemet kan delvis åtgärdas genom att aktivera PHP-CGI (vilket är standard på Dreamhost och andra hostingtjänster), men detta bryter standard Refeed konfiguration
  • Anledningen till den bryter beror på PHP: s inbyggda HTTP grundläggande autentisering misslyckas under initieringen
  • Ett annat skäl det bryter beror på att $ _SERVER ['SCRIPT_NAME'] variabeln är satt på olika sätt i ett PHP-CGI miljö.

Lösningen:

  • Kommentera ut PHP HTTP-autentisering i init.php
  • Add. Htaccess, om så önskas
  • Modifiera add.php att inkludera
    $ _SERVER ['SCRIPT_NAME'] = $ _SERVER ['SCRIPT_URL'];

Här är ett längre och kanske mer aktuell uppsättning noter .

Känsla Gruntled?

Min dotter ibland frågar mig om ord hon kommer över i sin läsning, att hon inte riktigt vet. I går kom hon över "missnöjda".

Jag förklarade att det betydde "inte alltför nöjd, eller missnöjd med något", vilket verkar rimligt nära. Vi hade också en diskussion om frånvaron av "Gruntled" som en motsvarighet till "missnöjda."

Det verkar som om "Gruntled" skulle betyda något i stil med "relativt nöjda eller nöjda med någonting."

En snabb sökning visar upp några referenser:

Esmerel :

De "dis" av missnöjda är inte samma sak som "dis" av "bestört." Det betyder "helt", och så "Gruntled," precis som det låter, är ett gammalt ord som betyder "muttra." Men i dag , "Gruntled" har funnit sin väg in i ordböcker som ett ord i sin egen rätt. Om man tittar på ursprunget, kommer du se att det ger "Gruntled" som en back-formation från "missnöjda." Folk antog att "missnöjda" var en negativ och uppfann ordet "Gruntled."

Denna person kom upp med en Websters ordbok definition och namngav deras hemsida efter "Gruntled":

Websters ordbok definierar Gruntled som:
grun • tle grun • tigade grun • tling [back-formation fr. IRRITERA] (1926)
verb transitiv
: Att lägga ett gott humor

Freesearch Dictionary :

Gruntled
Adjektivet HUMORISTISK
glad eller nöjd:
- Även om han inte var faktiskt missnöjda, var han långt ifrån Gruntled.

Känner du dig Gruntled idag?

Muddring för Search relevans

Jag är tydligen en väl utbildad, atypisk Sök användare.

Användare som studerats i en nyligen publicerad pappers användare klickade på den översta sökresultat nästan halva tiden. Inte ny, men i denna studie de bytte också resultatet för att vissa användare, och folk fortfarande mestadels klickade på den översta sökresultat

Jag skannar rutinmässigt hela sidan i sökresultaten, särskilt när jag inte är säker på var jag ska hitta den information jag söker. Jag ofta slumpmässigt klicka på de djupare resultatsidorna också, speciellt när man söker material från mindre synliga platser. Det fungerar för mig eftersom jag kan skanna text på sidan snabbt, och de ytterligare söksidor tillbaka också snabbt. Detta verkar fungera särskilt bra på Blog Search, där många platser är i grunden orankade för relevans.

Denna metod fungerar inte bra om du inte är van att skanna över sidor text, och dessutom fungerar inte om tids söksidan svar är långsam.

Å andra sidan, tog jag en snabb prova på några av exemplen i den forskning papper, och mina frågor (på Google) har i allmänhet svaret på de bästa 1-2 resultat redan.

Från Jakob Nielsens Alertbox , September 2005:

Professor Thorsten Joachim och kollegor vid Cornell University har gjort en undersökning av sökmotorer. Bland annat undersökte deras studie länkarna användarna följde på SERP (sökmotor resultatsidan). De fann att 42% av användarna klickade topp söka hit, och 8% av användarna klickade den andra träffen. Hittills har inga nyheter. Många tidigare studier, däribland min egen, har visat att de bästa få poster i söklistor få övervikt av klick och att antalet en träff får vida fler klick än något annat.

Det intressanta är forskarnas andra testet, där de i hemlighet utfodras sökresultaten genom ett manus innan de visas för användarna. Detta skript bytte ordningen på de två översta sökträffar. Med andra ord, det som ursprungligen var nummer två post i sökmotorns prioritering hamnade på topp, och den översta posten förvisades till andra plats.

I detta bytte tillstånd användare fortfarande klickade på den översta posten 34% av tiden och på den andra drabbade 12% av tiden.

För referens, här är de frågor som ställdes i den ursprungliga studien (182KB, PDF)

Navigations

  • Hitta hemsidan för Michael Jordan, statistikern.
  • Hitta den sida som visar ruttkartan för Greyhound bussar.
  • Hitta hemsidan för 1000 Acres Dude Ranch.
  • Hitta hemsidan för forskarutbildning bostäder vid Carnegie Mellon University.
  • Hitta hemsidan Emeril - kocken som har en tv tillagningsprogram.

Informations

  • Var är det högsta berget i New York ligger?
  • Med den tunga täckning av de demokratiska primärvalen, är du upphetsad för att lägga din röst på en kandidat. När är demokratiska primärvalen i New York?
  • Vilken skådespelare spelade som huvudperson i den ursprungliga Time Machine-film?
  • En vän sa att Mr Cornell brukade bo nära campus - nära universitetet och Steward Ave. Är det någon som bor i hans hus nu? I så fall vem?
  • Vad är namnet på den forskare som upptäckte den första moderna antibiotika?

Märka och Söka: Hur transparent vill du bli?

Denna anmärkning fångar några tankar som pågår, välkommen att chip in med era kommentarer ...

Här är en funktion önskelista för länk taggning:

  • Privat-bara länkar - bara jag kan se dem alls
  • Grupp-bara länkar - Endast medlemmar i gruppen kan se dem
  • Grupp-bara taggar - bara medlemmar i gruppen kan se min ansökan om en uppsättning taggar
  • Unattributed länkar - länk räknas och taggar är synliga för allmänheten, men inte bidragsgivaren eller kommentarer

Tagged bookmarking tjänster som del.icio.us möjligt för enskilda att spara och organisera sin egen samling av webblänkar, tillsammans med användardefinierade korta beskrivningar och taggar. Detta är redan praktiskt för den enskilde användaren, men den intressanta delen kommer från att kunna söka i hela universum av sparade bokmärken genom användardefinierade taggar som ett alternativ eller komplement till konventionella sökmotorer.

Bitar av kollektiva visdom som ingår i en gemenskap kan fångas med aggregering av användaråtgärder som representerar deras uppmärksamhet , dvs klickströmmar, bokmärken, taggar och andra inkrementella val som är förknippade med vad de råkade göra på nätet. Resultatet av en tagg ökning är oftast mycket mindre, men är ofta mer fokuserade eller lokalt relevant än en sökning på Google eller Yahoo.

Det är också intressant att bläddra bokmärken från andra människor som har märkt eller sparat liknande poster. Till viss del bokmärket och taggsamling kan behandlas som en proxy för personens uppsättning intressen och uppmärksamhet.

På ett liknande sätt, klicka på en länk (eller faktiskt köpa ett objekt), kan behandlas som en indikation av intresse. Detta är en del av det som gör Google Adsense, Yahoo Publisher Network, och Amazons rekommendationer arbete. De enskilda besluten är förknippade med någon persons erfarenhet, och tagit på egen hand har föga värde, men kan kombineras till informationsmängder som är till ömsesidig nytta för individen och nyhetsläsare. Web 2.0 lever på att dela "privat värdelös men socialt värdefull" information bidraget av individer mot en delad bra.

Vid bookmarking tjänster, är utbytet av värden: Jag får ett bekvämt sätt att spara mina länkar, och del.icio.us får min länk och tag data som ska delas med andra användare

Ett problem jag stöter regelbundet är att allt är offentligt på del.icio.us. För de flesta länkar jag till, jag är glad att dela dem, tillsammans med det faktum att jag tittade på dem, brydde sig för att spara den, och eventuella kommentarer och taggar jag tillägga. Del.icio.us börjar med antagandet att alla som bokmärkt något där skulle vilja dela. Eftersom jag använder det mer regelbundet, men jag tycker ibland situationer där jag vill spara något, men inte nödvändigtvis i den offentliga. Typiskt antingen

      a) inte vill göra URL synliga för allmänheten, eller
      b) inte har något emot att dela länken, men vill inte lämna en detaljerad spår öppet för allmänheten.

Det första fallet, där jag vill spara en länk till min privata bruk, är utan tvekan bara privat information och bör egentligen inte vara i en "sociala bokmärken"-systemet till att börja med. Det finns dock en social variant av privat länk, vilket är när jag vill dela mina länka data med en grupp, men inte alla användare. Det kan vara personer som t.ex. medlemmar i en projektgrupp, eller familj eller vänner. Det är analogt med de olika fotodelningsmodeller, där bilderna är vanligtvis delas för allmänheten, eller med olika system av restriktioner.

Det andra fallet, där jag är villig att dela mina länka data, men skulle vilja göra det utan tillskrivning, är intressant. I tänka på min länk bookmarking, jag tycker att jag är faktiskt beredd att dela min länk, och möjligen mina tagg och kommentera data, men vill inte ha någon bläddra min bokmärkeslistan och hitta det aggregerade samling där, eftersom det troligen introducerar för mycket insyn i vad jag arbetar med. Vid någon punkt i tid, det är också troligt att jag skulle vara glad att göra länka data fullt synliga, taggar, kommentarer och allt, kanske efter något projekt eller aktivitet är klar och förekomsten av denna information inte längre är lika känslig.

Funktionen önskelista ovan skulle ta upp några av de inte-riktigt-allmänna problem länk data, samtidigt som man fortsätter att växa ihop samhället bidrog uppgifter. Under tiden jag fortfarande ackumulera länkar tillbaka bakom brandväggen.

En annan användbar förändring till befintliga system skulle vara att aggregera tagg eller sökresultaten baserat på en utvald grupp av användare för att förbättra relevansen. Detta är i linje med Memeorandum , som använder en vald uppsättning av mer-auktoritativa bloggar som en utgångspunkt för att mäta relevansen av blogginlägg. I taggade sökandet fallet, skulle det vara intressant om jag kunde välja ett antal människor som "bättre" eller "mer relevant" på att skapa användbara länkar, och returnera sökresultat med ranking prioriterar sökning noder som var i närheten av länkar som märktes av min önskade gemenskap taggare.

Det är möjligt att prenumerera på specifika taggar eller användare på del.icio.us, men vad jag hade i åtanke var mer som att kunna märka de användare som "favoriter" eller efter ämne och sedan rangordna mina sökresultat baserat på deras länk och etikett stadsdelar. Jag egentligen inte vill titta på alla sina bokmärken hela tiden.

Något liknande kan också arbeta med sökresultat sidan klickfrekvens. Dessa typer av metoder verka lockande, men också verka för rörigt att skala mycket bra.

Unattributed länkar kan vara för känsliga för spam för att vara användbara. En möjlig fix kan vara att filtrera unattributed länkar baserade på myndigheten av källan, utan att avslöja källan till allmänheten.

Jag var på Techcrunch meetup igår, hade inte en chans att prata med de del.icio.us folk som var tydligen runt någonstans, men Ofer Ben-Shachar från Raw Sugar nämnde att de tittade på att ge någon form av grupp-bara tillgång alternativet för deras märkningssystem.

Mycket av detta skulle kunna hacka på de befintliga systemen för att lösa slutanvändaren problemet lätt, men några av de ursprungliga metoder som kommer att tänka börjar att bryta den sociala värdeskapande, och jag tror att de skulle bevaras samtidigt som bättre bestämmelser för " privat "eller" koncernen "begränsningar genom att arbeta på plattformssidan.

Pointless, oupphörliga skällande

Jag hade min egen blogg för ett tag, men jag bestämde mig för att gå tillbaka till meningslöst, oupphörliga skällande

Från New Yorker, via Business Week Blogspotting , som fann det här :

Denna tecknad film av Alex Gregory, som sprang i New Yorker om 12 september gör rundor på nätet.

För jämförelse, se Peter Steiners 1993 tecknade "På internet vet ingen att du är en hund", också från New Yorker, som ingår i Business Week inlägget.

Bättre information är inte alltid fördelaktigt

I dagens WSJ, David Wessels skisserar några systemiska sociala problem som kan uppstå när information blir allmänt tillgänglig till lägre kostnader.

Jag gillar den beskrivning av problemet i ett citat av Kenneth Arrow: "socialt värdelös men privat värdefull" information, som kan erbjuda individuella förmåner, men till en total kostnad för samhället i stort.

Detta är inversen av den dynamik kör "web 2.0", som lever på att dela "privat värdelös men socialt värdefull" information såsom klickströmmar, taggning, plats medvetenhet, närvaroinformation, etc.

Dator-och kommunikationsteknik gör mer och bättre information tillgänglig allt snabbare. Detta är en bra sak - vanligtvis.
Men det finns vissa saker som vi inte vill göra mer effektivt. Göra dem bättre lägger varken till den amerikanska nationella psyket och inte heller till bruttonationalprodukten. Räkna ut vilken som är vilken är en växande utmaning för samhället som tekniken gör insamling och analys av information enklare och billigare.

Denna fråga är äldre datorer. "Kontrasten mellan den privata lönsamheten och den sociala värdelöshet av förhandskännedom kan tyckas förvånande," den sena ekonomen Jack Hirshleifer skrev 1971. Men det finns fall, hävdade han, var "samhället som helhet får ingen nytta ... antingen från förvärvet eller spridning (av återförsäljning eller på annat sätt) av privat förhandskännedom. "

Föreställ dig en plats med osäkert väder där mat är gott om i regniga fläckar, men inte i andra. Invånarna i huvudsak köper försäkring. Den lyckliga mata otur. Ingen svälter. Då blir det möjligt att köpa exakta väderprognoser. Den som köper prognosen vet om han behöver försäkringen eller inte; han vinster. Men den totala mängden mat som finns är oförändrad. Och om alla köper väderprognosen blir försäkringsmarknaden omöjligt. "Det finns en dubbel social förlust - de resurser som används i onödan på att skaffa information och förstörelsen av en marknad för riskdelning," Mr Arrow sa när han ställde det här exemplet 1973.

Uppdatering 2005/09/23 10:31 PDT: Diskussion om detta ämne på Slashdot (bullriga, men en del intressanta kommentarer).

Katrina Relief - makro, mikro, och koreaner

Under de senaste veckorna har jag tittat på alternativ till Röda Korset för att hjälpa Katrina offer. Det har varit ett oroande antal frågor och byråkratiska problem med Röda Korset och andra stora hjälporganisationer under de tre + veckor sedan orkanen Katrina passerade New Orleans och dess omgivningar.

Även detta är delvis en fråga om den verkliga omfattningen av katastrofen, förvärras av frånvaro av arbets fysisk och administrativ infrastruktur, har det också visat en klyfta mellan de "makro" lättnad tjänster som tillhandahålls av de stora organisationer, och "mikro" relief tjänster som tillhandahålls av privatpersoner, lokala organisationer och ad hoc-grupper på plats i de drabbade områdena.

Makro: Från och med i måndags , har Röda Korset tillhandahålls miljoner övernattningar, varma måltider, kortsiktiga fonder, och sätta tusentals utbildade volontärer på marken. Detta är ett fantastiskt, enormt åtagande. De har också en häpnadsväckande fundraising-och utbildningsnätverk. Den omedelbara krisen fasen går förbi nu, dock, och tyvärr leder också samma organisatoriska massa som gör snabb respons på denna skala är möjligt att några av sina egna brister.

Till denna punkt: Jacob Appelbaum, som jag träffade förra månaden på Barcamp, har varit i New Orleans bygga trådlösa nätverk, VOIP telefon , låg effekt FM , och dokumentera sina erfarenheter finns i fotografier och hans blogg . En hög effekt mikrohjälparbetet på egen hand, här är hans observation på den lokala syn på Röda Korset :

Den amerikanska Röda Korset är förmodligen den minst respekterade av alla grupper i detta område. Lokalbefolkningen faktiskt hålla sig borta från Röda Korset på grund av sin erfarenhet. Om du funderar på att ge pengar till Röda Korset, prova att ge det till en mindre grupp först. Röda Korset är en uppsvälld företag och pengarna bäst kan användas på annat håll. De är fulla av goda människor och de menar väl jag tvivlar inte. Men de är verkligen ett exempel på en icke vinst som har blivit för stor.

Micro: Ett antal webbplatser som Reliefconnections.org , orkanen Katrina Direct Relief , Katrina Data Project , Katrina Hjälp Wiki tillhandahålla mekanismer för att matcha små organisationer och individer som vill hjälpa eller få hjälp. När dessa system fungerar, går donation av tid, pengar eller varor direkt från givare till mottagare där det behövs / ville, med effektivt noll overhead. Detta är den disintermedieringen av stora välgörenhet. Det finns begränsningar för vad som kan göras på detta sätt över internet. Första svaret är inte en av dem, så Röda korset, och organisationer som det fortfarande få mitt stöd. Men målinriktad uppföljning på hjälp är en enastående passform.

Ett av problemen med peer-to-peer välgörenhet och donationssystem är att ingen av parterna känner varandra, och det finns inga bra mekanismer för att fastställa rykte. Ett sätt är att arbeta med någon du känner eller har hört talas om, vilket är anledningen till välgörenhet branding och marknadsföring är viktigt. Alla har hört talas om Röda Korset, men förmodligen har inte hört talas om två killar som kör runt inrätta kommunikationstjänster för evakuerade.

Koreaner: Denna helg i vår kyrka, hörde vi en rapport om några av kyrkorna i Louisiana som bistår och bostäder orkanen Katrinas offer. En av våra församlingsmedlemmar, Alex Hull, reste till området förra veckan och arbetade med en UMCOR laget leverera förnödenheter till kyrkor i regionen. Denna resa var i första hand att bedöma situationen där för att se hur den lokala koreanska samhället kanske bäst hjälp. Som ett resultat, en grupp inklusive lokala koreanska kyrkor, Den koreanska IT-nät, koreanska torra rengöringsmedel Association, den koreanska Grocersanslutningen, International Association of Youth, koreanska amerikanska handelskammaren i Silicon Valley, iPark, Silicon Valley Athletic Association, och andra icke -vinstdrivande organisationer kommer att stödja hjälpinsatser tillsammans. Om du är i Bay Area, de accepterar varor och donationer på

    Koreanska amerikaner i Silicon Valley för Katrina Relief Fund
    10050 Bubb Road, Cupertino, CA 95014.

    Kontroller kan göras till "SVKCC - Katrina Fund"

Kontakterna vid vissa kyrkor som kommer att få hjälp är

    c / o Pastor Choi Jung In
    Orkanen Katrina katastrofhjälp för koreanska i Baton rouge (KHDRK)
    264 Burgin Avenue, Baton Rouge, LA 70808.
    225-768-7700
    c / o Ms Mary John Johnson
    Christ United Methodist Church
    5301 Old Canton Road, Jackson, fröken 39211
    601-956-0368

I allmänhet, nu när den omedelbara krisen har passerat, kommer jag att vara styra några personliga donationer mot specifika, mindre grupper, som till exempel de koreanska kyrkor eller Inveneo (VoIP) eller CU-Trådlöst (internet-tjänster).

Jag skulle också gärna se Röda Korsets delegat förvaltning av vissa av de inkommande Katrina donationer till andra organisationer som är mindre effektiva på fundraising men mer effektiva eller relevanta för behoven i samhället än vad Röda Korset i sig ger.

New York Times 2005/09/20 :

Organisationen har samlat nästan tre fjärdedelar av $ 1 miljard som amerikaner har skänkt för att hjälpa orkanoffer, med påskrifter från president Bush, corporate America och många ideella organisationer. Dess plikt, på uppdrag av kongressen, är att ge omedelbar hjälp, ett behov som snabbt minskar som offer lämnar skyddsrum.

Förhoppningsvis blir det inte en så stor respons som behövs varhelst orkanen Rita landar i ett par dagar.

Se även: Katrina Relief - Skicka Bits, Inte Atomer , Skulle Katrina Översvämning Cover Boston till Sudbury

Google Secure Access

via Om Malik :

Google seems to have developed a secure WiFi VPN software tool – Google Secure Access Client. The information can be found here. Google Rumors has all the details. To sum it up, what they are doing is giving away a VPN tool that takes some of the security risks out of open WiFi. Companies like JiWire and Boingo also have these type of secure WiFi software solutions. While on paper this sounds like a perfectly good deal, Inside Google says not so fast, and writes, “Google Secure Access has the same benefits for Google as Web Accelerator did, with fewer of the things that scared away people the first time.” They dig deep into the GSA privacy policy …

Another take at Inside Google :

Located at wifi.google.com, GSA connects you to a Google-run Virtual Private Network. Your internet traffic becomes encrypted when you send it out, decrypted by Google, the requested data downloaded by Google, encrypted and sent to you, and decrypted on your machine. This has the effect of protecting your traffic data from others who may want to access it. GSA's FAQ describes it as a Google engineer's 20% project

Google Secure Access FAQ

Word of Blog

Ord blogg :

Ord blogg är en ny och gratis tjänst som hjälper dig att sprida ordet om saker du gillar, evenemang du bryr dig om och välgörande ändamål som du vill stödja.

Bloggers: You can pick and choose any of the ads appearing on this site and display them into your blog or website. Bara att kopiera HTML-koden som visas nedanför annonsen och klistra in den där du vill att den ska visas. The ads have been formatted to fit into most blog columns.

Organizations: If you want to post an ad on this site so that bloggers can start spreading the “word of blog” about you, please go to the “Submit Ad” section.

Denna webbplats ger ett clearinghus för ideella organisationer att lägga upp sina annonser för att användas med bloggare och webbpublicister som vill bidra med sitt stöd.

It appears to be just getting started. De organisationer som anges som hittills omfattar traditionella frivilligorganisationer som Röda Korset, Grameen Foundation, CARE och United Way, tillsammans med diverse politiska grupper.

Det finns inget som förbjuder kommersiell användning, dock, så det kan vara översvämmas med kommersiella placeringar innan alltför länge. Det finns redan annonser gratis bröstimplantat, NeoPets och andra webbplatser som bara verkar vara ute efter synlighet. Inget fel med det, men de flesta bloggare och förlag är inte sannolikt att placera gratis annonser för en kommersiell webbplats.

Linksys WRT54G Vunerabilities

From SANS: Multiple Linksys WRT54G Vunerabilities , published: 2005-09-14

iDefense has released five vulnerabilities against the Linksys WRT54G wireless access point/switch/router. Some of these vulnerabilities are very serious. Users of these products are highly recommended to patch their devices. Patches for the latest versions are available at http://www.linksys.com .

This is one of the most popular and widely modified wireless routers out there. If you have one that's exposed to the public, time to patch it.

Here's the capsule descriptions, these look like fun:

  • Remote exploitation of a design error in the upgrade.cgi component of
    Cisco Systems Inc.'s Linksys WRT54G wireless router may allow
    unauthenticated modification of the router firmware.
  • Remote exploitation of a design error in multiple versions of the
    firmware for Cisco Systems Inc.'s Linksys WRT54G wireless router may
    allow unauthenticated modification of the router configuration.
  • Remote exploitation of an input validation error within the web
    management httpd component of Cisco Systems Inc.'s Linksys WRT54G
    wireless router may allow unauthenticated users to cause a denial of
    service (DoS).
  • Remote exploitation of a buffer overflow vulnerability in multiple
    versions of the firmware for Cisco Systems Inc.'s Linksys WRT54G
    wireless router may allow unauthenticated execution of arbitrary
    commands as the root user.
  • Remote exploitation of a design error in the 'restore.cgi' component of
    Cisco Systems Inc.'s Linksys WRT54G wireless router may allow
    unauthenticated modification of the router configuration.

What's Inside that Nano?

Alex Muse tar isär sin Apple iPod Nano och lägger ut bitarna så nyfikna av oss inte kommer att behöva.

Inside Apple's New Nano (wonder what's inside)

For some reason, I get a 1024×768 photo viewing this in my RSS reader, but only 425×321 viewing his web site directly. Uppenbarligen har den större foto bättre information.

Wonder if he can get it back together (and working)? Dessa kontakter ser ganska noga.

Uppdatering 2005/09/22 13:41 PDT: The Inquirer har några uppgifter om komponenterna från en rapport från iSuppli :

The firm offers a “teardown analysis” which it said showed the device uses a Portalplayer 5021C system on a chip and a Cypress CY8C21434 for the circuitry behind the “click wheel” interface.
...
It said that these, along with other ICs (integrated circuits), account for 77 per cent of the $90.18 total bill of materials (BOM) cost of the Nano.

Den NAND flashminne i enheten är tillverkad av Samsung, och iSuppli uppskattar det fick en stor rabatt från den koreanska jätten, vilket gör de dubbla NAND flash delar kostar bara $ 54.

ISuppli sade iPod Nano kostar $ 400 när du köper den.

Update 09-23-2005 10:41 PDT: Longer analysis of the iPod Nano bill of materials and margins at Business Week.

Silicon Valley ranks at the bottom – but I like it here

The front page of this morning's San Jose Mercury News announces that Silicon Valley is ranked last among 8 high tech areas in quality of life.

Unfortunately, you can't view the article without registering on their site .

Here's a similar article from the San Francisco Chronicle.

The report was put together by the Silicon Valley Leadership Group , and looked at 8 regions in the US, and excluded regions in other countries such as India and China. The report isn't on their site yet, but is supposed to be posted on Wednesday next week.

Here's how we stack up:

      Unemployment Rate – Fairfax County #1, Silicon Valley #7
      Housing Affordability – Raleigh-Durham #1, Silicon Valley #7
      Traffic Congestion – Raleigh-Durham #1, Silicon Valley #8
      8th Grade Math Scores – Boston #1, Silicon Valley #8
      Electrical Costs – Portland #1, Silicon Valley #6
      Health Insurance – Boston #1, Silicon Valley #6
      State Tax Rate – Seattle #1, Silicon Valley #6

The overall ranking for US tech regions with best quality of life:

      #1 Raleigh-Durham, North Carolina
      #2 Fairfax County, Virginia
      #3 Seattle, Washington (tie)
      #4 Boston, Massachusetts (tie)
      #5 Portland, Oregon
      #6 Austin, Texas
      #7 San Diego, California
      #8 Silicon Valley, California

I don't have to drive much, so I mostly dodge the traffic issue. I like many of the areas on the list, but have to say that I have never even considered living in Raleigh-Durham. Perhaps it's different than I remember, I haven't been there in some time.

On the positive side for Silicon Valley, the same article notes that a typical employee here 2.5 times more productive than the national average, the valley receives about 1/3 of all US venture capital, and 10 percent of all patents issued in the US. This is a great place to do new stuff, but a terrible place to build up huge labor-intensive organizations.

Plus we have Barcamp , and the ability to form projects, companies, and communities at the drop of a hat.

Sydkorea blir den största utländska investeraren i Indien

Efter många turer fram och tillbaka, har jag alltid slagits av förekomsten av koreanska produkter i Indien. There are ads for LG and Samsung appliances, Hyundai cars, and they seem to have collectively gotten the hang of building “locally appropriate” products, as opposed to attempting to go to market there with a “global standard” product.

From Newsweek on MSN (via Indian Economy Blog )

Sept. 19, 2005 issue – In one whopping megadeal, South Korea has become the largest foreign investor in Asia's second emerging giant, India. Den 31 augusti, etablerade koreanska ståltillverkaren Posco ett lokalt dotterbolag i östra indiska delstaten Orissa, vilket banar väg för en kontroversiell kvarn och gruvkomplex som kommer att kosta världens femte största ståltillverkare $ 12000000000 och sysselsätter cirka 40.000 arbetare när det är i full drift 2010.

Sydkoreanska företag som Hyundai, LG och SK Group har skaffat sig en betydande närvaro i landet-världens näst största och en potentiellt stor marknad för produkter som kylskåp, tvättmaskiner och tv-apparater.

The Posco deal in Orissa, though, is a completely different sort of project. Detta är ett stort naturresurser projekt, att rada upp tillgång till järn och stål för att möta ökande tillverknings efterfrågan i-land inom Indien. Förutom ett stort behov av grundläggande förbättringar av infrastrukturen (vägar, motorvägar och flygplatser), fler människor flyttar till olika hem, eller större bostäder, och fylla dem med fler vitvaror och elektronik.

Hacking the Timex Bodylink – Part 2

Here's some sample data, and an example of how to read the heart rate data from the binary dump file eeprom.bin, continuing from part 1 of my notes on the Timex Bodylink.

This is what we don't want to see when using the Timex Trainer software to download from the data recorder.
Timex Trainer Application Error

In my case, this happened in the middle of a long (4+ hour HRM and GPS) data download. I suspect, but can't confirm, that this was related to leaving the “speed smoothing” function on and tripping over an unhandled exception related to a missing point or something along those lines. I didn't seem to have problems after disabling the smoothing option.

When retrying the download, the Timex software would complain:

Timex Trainer stängs oväntat under den senaste dataöverföring. Detta kan tyda på ett problem med hur data lagras i minnet för Data Recorder. Kontrollera alla anslutningar till Data Recorder och se Recorder batteri är NOTL utmattad, försök sedan överföringen igen. Om överföringen är fortfarande misslyckas, kan du behöva radera data i Data Recorder (se hjälp förfarandet). Tyvärr innebär detta att alla data som lagrats i Data Recorder kommer behat UE till en lös kabel eller låg batteri. Om du fortfarande har problem efter att Data Recorder minnet har raderats, kontakta Timex kundtjänst.

I mitt fall hade jag en ny uppsättning batterier i GPS-pod, HRM bandet, och i dataspelaren, så det var inte problemet. Den Timex programvara ger en rådata dump verktyg, som jag använde för att spara en kopia av bitarna med. Detta tar de binära data direkt från datainspelningsminnet utan att försöka någon bearbetning, och alltid verkar fungera händelselöst, även när programvaran annars klagar.

Jag tillbringade en kväll söker på nätet för en fix utan lycka, och även talade med Timex tjänst i telefon, även utan lycka, så jag är kvar med data och en del nyfikenhet.

Här är några bitar för alla som vill spela med hemma:

Data dumpa från 2004 Big Sur Marathon: eeprom-Timex-040425.bin (46KB) och eeprom-Timex-040425.txt 143KB)
Det är cirka 5 timmar av HRM plus GPS-data, med tidsstämpel förmodligen felaktigt eftersom jag inte minns att återställa den efter byte av data recorder batteriet.

Här är en annan data dumpning av en 75 minuters HRM + GPS-run: eeprom-Timex-040516.bin (12KB) och eeprom-Timex-040516.txt (37 kB)

Denna körning var cirka 75 minuter, 7,5 miles, och kom efter att ge upp på ett användbart svar från Timex kundsupport, och återställning av data recorder med knappen nedsänkta silver på baksidan av enheten. Den här gången kom jag ihåg att ställa in tiden efter återställning av enheten.

Här är en data dumpning av en HRM-bara köra: eeprom-Timex-040517.bin (3KB), eeprom-Timex-040517.txt (9KB)

Denna körning var en 70 minuters löpband kulle intervall session. Det finns bara en session i brännaren, som föregående sammanträde godkändes.

Nu låt oss ta en titt på uppgifterna. Här är toppen av HRM-enda session:

 80 01 00 94 0B 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
 00 11 03 0C 10 04 04 63 65 65 65 68 6A 6A 68 69
 69 68 6B 6C 6B 6A 68 67 66 6B 68 69 69 6B 6C 6E
 6F 6E 6E 6E 6E 6F 70 70 6F 70 6F 6F 6F 6C 6D 6D
 6C 6D 6D 6C 6B 68 66 66 67 68 68 68 68 67 68 67
 66 67 68 68 68 68 6A 6B 68 68 68 68 67 68 68 68
 69 68 67 67 65 66 66 67 67 64 64 64 65 64 64 64
 66 6B 6B 6B 68 68 68 67 67 64 64 64 65 65 65 66
 66 63 63 63 67 68 65 67 67 65 65 65 64 64 64 65
 64 62 62 62 63 62 62 63 63 62 63 62 63 63 63 66
 65 64 63 63 63 63 63 62 64 64 6B 6C 6D 6E 70 72
 72 72 72 72 72 72 72 73 74 75 75 76 76 76 76 77
 77 77 79 79 7A 79 77 77 77 78 79 79 79 79 79 77
 77 79 79 79 7A 7A 7A 7C 7C 7C 7C 7C 7D 7D 7D 7E
 7D 7E 7E 7E 7F 7F 7E 7E 7E 80 7F 7F 7F 7F 80 7E
 7E 7D 7E 7D 7D 7D 7E 7F 7F 7F 7F 80 7F 7F 7F 7E
 7F 7D 7D 7B 7C 7D 7E 7E 80 81 81 83 83 83 83 82

Så här läser pulsdata dump:

Den första 240 byte innehåller katalog header information för alla sessioner i inspelningsminnet.

De första 2 byte innehåller det magiska numret

  80 01 

De efterföljande tre byte innehåller förskjutningen i bitgrupper till slutet av den N: te datasession.
I detta fall har vi

  00 94 0b 

Efter byteswapping till

  00 0b 94 

detta fungerar till 2964, vilket är längden på den binära soptipp. Om det fanns ett andra datasession loggas, skulle det börja vid offset 2964 från toppen av minnet.

Nu ska vi titta på de faktiska sessionsdata. De första 240 byte verkar vara reserverat för lagring av sessions förskjutningar. Början av intressanta uppgifter ser ut så här:

  00 11 03 0C 10 04 04 63 65 65 65 68 6A 6A 68 69 

De första pulsposter som dyker upp i Timex Trainer för denna session är

  99.101.101.101.104.106.106.104.105.105.104 

I hex, skulle detta vara

  63,65,65,65,68,6 A, 6A, 68,69,69,68 

Så det ser ut som det finns en session 7 byte-huvudet. Detta är förmodligen bara en serialiserad intern datastruktur från Timex Trainer programvara, som verkar vara byggd med Visual Basic for GUI, och en DLL för att hantera enhetens funktioner, troligen skrivna i C.

Från att titta på olika rubriker, här är hur man läser sessionen header:

  00 11 03 0C 10 04 04 

00 = pulsdata endast
11 hex = 17 decimal = sekunder
03 hex = 03 decimal = minuter
0C hex = 12 decimal = timmar
10 hex = 16 decimal = dag
04 hex = 04 decimal = månad (0 = januari)
04 hex = 04 decimal = år (0 = 2000)

Så här sessionen börjar på 12:03:17 den 16 maj 2004.

Efter pulsdata startar, det finns inte mycket annat som händer här, eftersom det inte finns några GPS-skivor blandas i. Ibland ser vi ut ungefär så här i mitten av data:

  59 59 59 59 60 60 60 61 00 00 00 00 00 00 54 00
 00 00 00 00 00 04 66 65 66 69 68 68 67 68 00 6B 

Jag tror att brännaren bara fyller i nollor när det inte har en giltig inmatning.

I slutet av pulsdata session, vi återigen se en 7 byte avslutande rekord.

  00 31 1C 0D 10 04 04 

Inte så säker på denna del, men det

  04 04 

tycks dyka upp i slutet av andra datasessioner.

Vid det här laget bör du nu med säkerhet kunna extrahera pulsdata från rådata dumpa tillhandahålls av Timex Bodylink registratorn.

Nästa inlägg i denna serie kommer att titta på GPS-baserade hastighet och sträcka.

Se även: Hacking Timex Bodylink - Del 1

iTunes har video podcasting stöd

I wrote earlier today about my reluctant late-adopter status for audio podcasting , and now I come across an article about Apple quietly introducing video content to iTunes Music Store.

The quiet, fanfare-less launch of video podcasting (in fact, it's not even clear when it was launched) is a bit surprising for the company, but there may be a reason: there's not too many video podcasts out there in the wild. Furthermore, video podcasts are currently only playable on your computer, although it seems clear enough that a video iPod is on the way. If you didn't believe it before, you should definitely believe it now.

I don't recall if anyone mentioned video on iTunes at last night's Search SIG discussion . Ev Williams (from Odeo) commented that a lot of what makes audio podcasting compelling doesn't apply to video, in that audio can be consumed anywhere, and has an existing use model (drive-time radio), while video is typically consumed while sitting down in front of an increasingly large television at home. Eric Rice did show a live demo of video blogging on Audioblog, illustrating the possibility of large scale user-created video content in the future. I'm not sure who's going to look at all the video, though. Perhaps the same people who are watching reality TV shows.

Once again, I'm well outside the demographic, since I barely watch any television at all these days. If I could get a commercial video podcast service to replace cable TV with, I'd probably subscribe now, though.

Google Blog Search – Referrers Working Now

Looks like Google Blog Search took out the redirects that were breaking the referrer headers .

Now the search keywords are visible again. Here's a typical log entry:

xxx.xxx.xxx.xxx – - [15/Sep/2005:15:58:13 -0700]
“GET /weblog/archives/2005/09/15/podcasting-and-audio-search-at-sdforum-searchsig-september-2005/
HTTP/1.1″ 200 26981 “http://blogsearch.google.com/blogsearch?hl=en&q=odeo&btnG=Search+Blogs&scoring=d”
“Mozilla/5.0 (Macintosh; U; PPC Mac OS X Mach-O; en-US; rv:1.7.10) Gecko/20050716
Firefox/1.0.6″

Blogger Buzz says the redirect was in place during development to help keep the project under wraps.

Podcasting and Audio Search at SDForum SearchSig September 2005

IMG_4360 IMG_4361

Discussion and demos on podcasting and audio search last night at the inaugural SDForum Search SIG meeting .

Jag vill gärna podcasting, men hittills har jag inte riktigt kommit in i det, antingen som lyssnare eller som producent. I teorin borde jag vara över detta, eftersom den kombinerar några av mina favoritämnen: medieteknik (mestadels ljud, men så småningom video), internet publicering och distribution, och sök (som verkar vara under allt på internet). I praktiken har jag inte hittat en bra passform i min dagliga rutin ännu, dels för att jag inte har en lång bilresa till jobbet. Jag ibland lyssna på musik medan jag arbetar, men ofta behöver vara på telefonen. Jag är slags intresserad av några av de Klartext-, som de på IT-konversationer , men jag kan läsa liknande innehåll i en bråkdel av den tid som krävs för att lyssna på en podcast segment, och jag tycker att jag inte kan lyssna på dem medan jag arbetar som jag antingen bli distraherad från mitt arbete eller helt ställa ut innehållet. Jag brukar inte använda iPod mycket heller, för en del av samma skäl.

Allt det åt sidan, de demos av Loomia , Odeo och Audioblog visade hur snabbt de verktyg och tjänster för att skapa och distribuera podsändningar och personliga medier förbättras. De ger alla kataloger och söktjänster för att hitta podcasts, och går mot att tillhandahålla verktyg och hosting-tjänster för privatpersoner att skapa och publicera sina egna ljud podsändningar.

David Marks visade Loomia , vilket ger en omfattande, personalizable katalog av podcast feeds. På webbplatsen finns en infogade Flash ljudspelare, så att du kan spela feeds direkt i webbläsaren sidan, som jag försöker ut medan jag skriver detta. Han nämnde också att deras webbplats använder sig av Dojo öppen källkod bibliotek för att implementera AJAX funktioner.

Bild från Niall Kennedy

Ev Williams visade Odeo Studio programmet, som ännu inte är tillgänglig på deras hemsida. Det sätter en enkel ljudproduktion app i webbsidan, så att du kan spela in med en datormikrofon och blanda in ljud som tema musik, applåder, och ljudeffekter. Ser ut som roligt, och tar bort ett annat hinder för potentiella podcast skapare som kanske inte har lust att gå att hitta och lära sig att använda en ljudredigerare.

Eric Rice visade Audioblog s videoklipp publikationstjänst, tillsammans med hur man "ringa in" och skapa en podcast genom att lämna ett röstmeddelande. Även om deras webbplats kallas "Audioblog", utvecklar de en hel del liknande videofunktioner. Deras webbplats kommer också att koda video från en mängd olika format, inklusive 3GP; Detta ger dem möjlighet att ta emot video uppladdningar från mobiltelefoner. De kommer att vara värd mediedata, och det lät som om de var ute på hantering klaremedierättigheter med ASCAP och andra konstnärer organ på uppdrag av sina förläggare någon gång i framtiden.

Öppningen paneldiskussion, ledd av Doug Kaye, bör dyka upp på IT-konversationer på ett tag, jag ska försöka kolla upp det senare.

Som en bonus, jag träffade också Munjal Shah och Tara Hunt personligen efteråt. Jag ser fram emot att försöka Ojos bildsök alfa när de får det kokats tillräckligt.

Uppdatering 2005/09/15 20:01 PDT: lagt till ett foto av Odeo Studio från Niall Kennedy, plus en uppföljning på iTunes och video podcasting

Uppdatering 2005/10/20 21:26 PDT: Länkar till ljudet på IT Konversationer publiceras på Yahoo Search Blog

Jobbet av en mjukvaruarkitekt

I caught a couple of the sessions at the SD Forum Web Based Architecture event yesterday. Adam Denning (Senior Director of the Architecture Strategy Team, Microsoft) prefaced his talk by noting the grand titles that software architects often end up with, and the often fuzzy and open-ended nature of the territory.

I liked this take on the role of the software architect, from someone in the audience, which I think was Pat Helland from Amazon:

Q: What's the job of a software architect?
A: “Make stuff up and sucker people into building it!”

IMG_4357 IMG_4358

Someone else in the audience observed that unlike physical world architects, software architects are often involved in actually implementing their designs.

Andre Stechert , Kevin Burton , Alok Bhanot, and Colin Johnson had a panel session after lunch. Andre thinks of software architecture as “the parts of the product that are hard to change”.

On rolling out new software: Kevin observes that apps with large user bases (looks at Alok at eBay) are generally penalized for deploying too early, because of a higher premium on stability and security, while startups are penalized for deploying too slowly, because their main issues are establishing a competitive position in the marketplace before burning through their startup resources. Alok says simplicity is good, overengineering is a risk, eBay has 7 levels of processes, sometimes you don't anticipate the success of your product. (He also avoids citing any specific war stories.)

Google Blog Search – No Referrer Keywords?

Feature request to Google Blog Search team: please add search query info to the referrer string.

Lots of coverage this morning from people trying out Google Blog Search. ( Search Engine Watch , Anil Dash , lots more )

I'm seeing some traffic from Google Blog Search overnight, but it looks like they don't send the search query in the referrer. Here's a sample log entry:

xxx.xxx.xxx.xxx – - [14/Sep/2005:00:51:09 -0700] “GET /weblog/archives/2005/09/14/google-blog-search-launches/ HTTP/1.1″ 200 22964 “http://www.google.com/url?sa=D&q=http://www.hojohnlee.com/weblog/archives/2005/09/14/google-blog-search-launches/” “Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.7.8) Gecko/20050511 Firefox/1.0.4″

So there's no way to know the original search query. I have a pretty good idea how the overnight traffic looking for the Google post got here, but there are also people landing on fairly obscure pages here and I'm always curious how they found them. I'm sure the SEO crowd will be all over this shortly.

Det har funnits ett antal synpunkter som Google Blog Search är slags tråkigt, men jag finner att det finns bra nyhetsvärde i att ha riktigt snabba sökresultatsidor. Haven't used it enough to get a sense of how good the coverage is, or how fast it updates, but it will be a welcome alternative to Technorati and the others.

Update 09-14-2005 14:01 PDT: These guys think Google forgot to remove some redirect headers .

Update 09-14-2005 23:25 PDT: Over at Blogger Buzz , Google says they left the redirect in by accident, will be taking them out shortly:

“After clicking on a result in Blog Search, I'm being passed through a redirect. Varför? "
Sadly, this wasn't part of an overly clever click-harvesting scheme. We had the redirects in place during testing to prevent referrer-leaking and simply didn't remove them prior to launch. But they should be gone in the next 24 hours … which will have the advantage of improving click-through time.

Page 1 of 3 1 2 3