Bokmärken för 30 januari via 4 februari

Detta är mina länkar för 30 januari via 4 februari:

  • Op-Ed skribent - Microsofts Creative Destruction - NYTimes.com - Till skillnad från andra företag, Microsoft aldrig utvecklat ett riktigt system för innovation. Några av mina tidigare kollegor hävdar att det faktiskt utvecklat ett system för att förhindra innovation. Trots att en av de största och bästa företags laboratorier i världen, och lyxen att inte en utan tre främsta teknik officerare, förvaltar företaget rutinmässigt för att omintetgöra de ansträngningar som dess visionära tänkare.
  • Leonardo da Vincis Resume förklarar varför han är Renässansen man för jobbet - Davinci - Gizmodo - Vid ett tillfälle i historien, även da Vinci själv var tvungen att skriva ett CV för att förklara varför han var en kvalificerad sökande. Här är en översättning av hans brev till hertigen av Milano, avgränsa sina många talanger och förmågor. "Mest lysande Herre, ha nu tillräckligt beaktat de exemplar av alla dem som proklamerar sig duktiga contrivers av instrument för krig, och att uppfinningen och driften av dessa instrument är inget annorlunda än i gemensamt bruk: Jag skall inte påverka sträva efter att någon annan, för att förklara mig för Ers excellens, visar din Lordship min hemlighet, och sedan erbjuda dem till din bästa njutning och gillande för att arbeta med den vid lägliga ögonblick på alla de saker som, delvis, skall kortfattat anges nedan .. Dokumentet, skrivet när da Vinci var 30, är ​​faktiskt mer av ett personligt brev än ett CV, han lämnar ut många av sina konstnärliga framgångar och istället fokuserar på vad han kan ge hertigen i teknik av krig.
  • jsMath: jsMath Hemsida - Den jsMath paketet ger en metod för att bland annat matematik i HTML-sidor som fungerar över flera webbläsare i Windows, Macintosh OS X, Linux och andra varianter av Unix. Det övervinner ett antal av bristerna i den traditionella metoden att använda bilder för att representera matematik: jsMath använder infödda typsnitt, så de ändrar storlek när du ändrar storlek på texten i webbläsaren, de ut med full upplösning på skrivaren, och du behöver inte vänta på ett tiotal bilder som ska laddas ned för att se matematiken i en webbsida. Det finns också fördelar för web-sida författare, eftersom det inte finns något behov av att förbehandla dina webbsidor för att generera några bilder, och matematiken anges i TeX formuläret, så det är lätt att skapa och underhålla dina webbsidor. Även om det fungerar bäst med TeX teckensnitt installerade, kommer jsMath falla tillbaka på en samling av bildbaserade teckensnitt (som fortfarande kan skalas eller skrivas ut med hög upplösning) eller Unicode-teckensnitt när TeX teckensnitt är inte tillgängliga.
  • Josh på webben »Blog Archive» missbruka Cache: Tracking Användare utan Cookies - Om du vill spåra en användare använder sig av tre webbadresser: behållaren, vilket kan vara en webbplats, en shim-fil, som innehåller en unik kod, samt en spårning sida, vilka butiker (och i det här fallet visar) begäran. Tricket ligger i att göra webbläsarens cache mellanlägget filen på obestämd tid. När filen begärs för den första - och enda - gången en unik identifierare är inbäddad i sidan. Mellanlägget bäddar in spårningssidan, går det unika ID varje gång den är laddad. Se källkoden.

    En snygg sak om denna metod är att Javascript inte är absolut nödvändigt. Den används endast för att skicka meddelandet och remitterande till trackern. Det skulle förmodligen vara möjligt att ersätta de iframes med CSS och bilder för att få JS fria HTTP referrer loggning men skulle förlora förmågan att lagra meddelanden så lätt.

  • Panopticlick - Din webbläsare fingeravtryck verkar vara unik bland de 342.943 testat hittills.

    För närvarande bedömer vi att din webbläsare har ett fingeravtryck som förmedlar åtminstone 18.39 bitar av identifierande information.

    De mätningar som vi använde för att erhålla detta resultat är listade nedan. Du kan läsa mer om den metod här, och om några försvar mot fingeravtryck här

Bokmärken för 23 januari genom 30 januari

Detta är mina länkar för januari 23 genom 30 januari:

  • Leonardo da Vincis Resume förklarar varför han är Renässansen man för jobbet - Davinci - Gizmodo - Vid ett tillfälle i historien, även da Vinci själv var tvungen att skriva ett CV för att förklara varför han var en kvalificerad sökande. Här är en översättning av hans brev till hertigen av Milano, avgränsa sina många talanger och förmågor. "Mest lysande Herre, ha nu tillräckligt beaktat de exemplar av alla dem som proklamerar sig duktiga contrivers av instrument för krig, och att uppfinningen och driften av dessa instrument är inget annorlunda än i gemensamt bruk: Jag skall inte påverka sträva efter att någon annan, för att förklara mig för Ers excellens, visar din Lordship min hemlighet, och sedan erbjuda dem till din bästa njutning och gillande för att arbeta med den vid lägliga ögonblick på alla de saker som, delvis, skall kortfattat anges nedan .. Dokumentet, skrivet när da Vinci var 30, är ​​faktiskt mer av ett personligt brev än ett CV, han lämnar ut många av sina konstnärliga framgångar och istället fokuserar på vad han kan ge hertigen i teknik av krig.
  • jsMath: jsMath Hemsida - Den jsMath paketet ger en metod för att bland annat matematik i HTML-sidor som fungerar över flera webbläsare i Windows, Macintosh OS X, Linux och andra varianter av Unix. Det övervinner ett antal av bristerna i den traditionella metoden att använda bilder för att representera matematik: jsMath använder infödda typsnitt, så de ändrar storlek när du ändrar storlek på texten i webbläsaren, de ut med full upplösning på skrivaren, och du behöver inte vänta på ett tiotal bilder som ska laddas ned för att se matematiken i en webbsida. Det finns också fördelar för web-sida författare, eftersom det inte finns något behov av att förbehandla dina webbsidor för att generera några bilder, och matematiken anges i TeX formuläret, så det är lätt att skapa och underhålla dina webbsidor. Även om det fungerar bäst med TeX teckensnitt installerade, kommer jsMath falla tillbaka på en samling av bildbaserade teckensnitt (som fortfarande kan skalas eller skrivas ut med hög upplösning) eller Unicode-teckensnitt när TeX teckensnitt är inte tillgängliga.
  • Josh på webben »Blog Archive» missbruka Cache: Tracking Användare utan Cookies - Om du vill spåra en användare använder sig av tre webbadresser: behållaren, vilket kan vara en webbplats, en shim-fil, som innehåller en unik kod, samt en spårning sida, vilka butiker (och i det här fallet visar) begäran. Tricket ligger i att göra webbläsarens cache mellanlägget filen på obestämd tid. När filen begärs för den första - och enda - gången en unik identifierare är inbäddad i sidan. Mellanlägget bäddar in spårningssidan, går det unika ID varje gång den är laddad. Se källkoden.

    En snygg sak om denna metod är att Javascript inte är absolut nödvändigt. Den används endast för att skicka meddelandet och remitterande till trackern. Det skulle förmodligen vara möjligt att ersätta de iframes med CSS och bilder för att få JS fria HTTP referrer loggning men skulle förlora förmågan att lagra meddelanden så lätt.

  • Panopticlick - Din webbläsare fingeravtryck verkar vara unik bland de 342.943 testat hittills.

    För närvarande bedömer vi att din webbläsare har ett fingeravtryck som förmedlar åtminstone 18.39 bitar av identifierande information.

    De mätningar som vi använde för att erhålla detta resultat är listade nedan. Du kan läsa mer om den metod här, och om några försvar mot fingeravtryck här

  • Benlog »Inte Hash Secrets - Om jag säger att SHA1 (foo) är X, så visar det sig i många fall vara ganska lätt för dig att avgöra vad SHA1 (foo | | bar) finns. Du behöver inte veta vad foo är. eftersom SHA1 är iterativ och arbetar kvarter för kvarter, om du känner till hash av foo, då kan du utöka beräkningen för att bestämma hash av foo | | bar

    Det betyder att om du vet SHA1 (hemligt | | meddelande) kan du beräkna SHA1 (hemligt | | meddelande | | NÅGOT), vilket är en giltig signatur för meddelande | | NÅGOT. Så för att bryta detta system, behöver du bara se en signatur från SuperAnnoyingPoke, då kan du imitera SuperAnnoyingPoke för massor av andra meddelanden.

    Vad du ska använda är HMAC: Hash-funktionen Message Authentication Code. Du behöver inte veta exakt hur det fungerar, bara behöver veta att HMAC är speciellt byggd för meddelandeautentiseringskoder och användningen fallet SuperAnnoyingPoke / myface. Under huven, vad är ungefär händer är två hashar, med den hemliga kombineras efter första hash

  • Data.gov - Dagens version Resultat: Open regeringens direktiv Agency - Dataset krävs enligt Open regeringens direktiv till slutet av dagen, 22 januari 2010. Freedom of Information Act begäran loggar, Treasury TARP och derivataktivitetsloggar, kriminalitet, inkomster, jordbruk dataset.

Bokmärken för 31 december och med 17 januari

Detta är mina länkar för 31 december genom 17 januari:

  • Khan Academy - The Khan Academy är en icke-vinstdrivande organisation med uppdrag att ge en utbildning av hög kvalitet för alla, överallt.

    Vi har 1000 + videoklipp på YouTube som täcker allt från grundläggande aritmetik och algebra till differentialekvationer, fysik, kemi, biologi och finans som har registrerats av Salman Khan.

  • Starcraft AI Tävling | Uttrycksfull Intelligence Studio - AI bot krigföring konkurrens med hjälp av en hackad API för att köra Starcraft, kommer att hållas på AIIDE2010 i oktober 2010.
    Tävlingen kommer att använda Starcraft Brood War 1.16.1. Bots för Starcraft kan utvecklas med hjälp av Broodwar API, som ger krokar i Starcraft och möjliggör utveckling av anpassade AI för Starcraft. En C + +-gränssnitt gör det möjligt för utvecklare att fråga det aktuella läget av spelet och utfärda order till enheter. En introduktion till Broodwar API finns här. Instruktioner för att bygga en bot som kommunicerar med en fjärrprocess finns här. Det finns också ett forum. Vi uppmuntrar inlämning av robotar som använder sig av avancerad AI tekniker. Några idéer är:
    * Planering
    * Data Mining
    * Maskininlärning
    * Case-Based Reasoning
  • Mätning Åtgärder: Lär dig mer om statistisk inlärning - En "Quick Start Guide" för statistik-och maskinsystem lärande, bra samling av referenser.
  • Berkowitz et al: Användningen av formella metoder för att kartlägga, analysera och tolka Hawala och terroristrelaterade alternativa överföringssystem (2006) - Berkowitz, Steven D., Woodward, Lloyd H., & Woodward, Caitlin. (2006). Användning av formella metoder för att kartlägga, analysera och tolka Hawala och terroristrelaterade alternativa överföringssystem. Ursprungligen avsedd för publicering i att uppdatera 1988 års volym, eds, Wellman och Berkowitz, Sociala strukturer:. En nätverksstrategi (Cambridge University Press). Steve dog i november 2003. Se Barry Wellman s "Steve Berkowitz: Ett nätverk Pioneer har gått bort," i Anslutningar 25 (2), 2003. Det har inte varit möjligt att lägga till uppdateringen av referenser eller om kvaliteten på grafiken som skulle ha varit möjligt om Berkowitz levde. En tidig version av artikeln publicerades i Proceedings of the session om bekämpande av terroristnätverk: Current Research in Social Network Analysis för det nya kriget Fighting miljö. 8th International Command and Control Research and Technology Symposium. National Defense University, Washington, DC 17 till 19 juni, 2003
  • SSH Tunneling via webbfilter | s-anand.net - Steg för steg handledning om hur du använder Putty och en EC2 instans att inrätta en egen webbproxy på efterfrågan.
  • PyDroid GUI automation verktygslåda - GitHub - Vad är Pydroid?

    Pydroid är ett enkelt verktyg för att automatisera och scripting repetitiva uppgifter, speciellt de som involverar ett GUI, med Python. Den innehåller funktioner för att styra musen och tangentbordet, hitta färger och bitmappar på skärmen, samt visning plattformar varningar.
    Varför använder Pydroid?

    * Testa ett GUI ansökan om buggar och kantfall
    o Du kanske tror att din app är stabil, men vad händer om du trycker på den knappen 5000 gånger?
    * Automatisera spel
    o Att skriva ett manus för att slå det skit flash spel kan vara så mycket mer glädjande än att spendera timmar på att spela det själv.
    * Freaking vänner och familj
    o Tja kanske det är egentligen inte en praktisk användning, men ...

  • Time Series Data Library - Fler datamängder - "Detta är en samling av cirka 800 tidsserier hämtas från många olika fields.Agriculture Kemi Brott Demografi Ekologi Ekonomi Hälsa Hydrology Industry Arbetsmarknad Makroekonomi Meteorologi Mikroekonomi Diverse Fysik Production Sales Simulerad serien Sport Transport & Turism Tree-ringar Utilities "
  • Hur informativ är Twitter? »SemanticHacker Blog -.. "Vi genomförde en liten studie för att karakterisera olika typer av meddelanden som kan hittas på Twitter Vi hämtade ett urval av tweets under en tvåveckorsperiod med hjälp av Twitter streaming API Detta resulterade i en korpus med 8,9 miljoner meddelanden ("tweets") inlagt av 2,6 miljoner unika användare. Om 2,7 miljoner av dessa tweets, eller 31%, var svar på en tweet postat av en annan användare, medan en halv miljon (6%) var retweets. Nästan 2 miljoner (22 %) av de meddelanden som innehåller en URL-adress. "
  • Gremlin - en Turing-komplett, grafbaserade programmeringsspråk - GitHub - Gremlin är en Turing-komplett, grafbaserade programmeringsspråk utvecklat i Java 1.6 + för nyckel / värde-par multi-relationella grafer kallas fastighets grafer. Gremlin gör omfattande användning av XPath 1.0 språket för att stödja komplexa graftraverse. Detta språk har tillämpningar inom områdena graf fråga, analys och manipulation. Anslutningar finns för följande system datahanterings:

    * TinkerGraph in-minne grafen
    * Neo4j grafdatabas
    * Sesam 2,0 kompatibla RDF lagrar
    * MongoDB dokumentdatabas

    Dokumentationen för Gremlin kan hittas på denna plats. Slutligen, besök TinkerPop för andra mjukvaruprodukter.

  • The C Programming Language: 4,10 - efter Kernighan & Ritchie & Lovecraft - ogiltig Rlyeh
    (Int mene [], int wgah, int Nagl) {
    int Ia, fhtagn;
    if (wgah> = Nagl) avkastning;
    swap (mene, wgah, (wgah + Nagl) / 2);
    fhtagn = wgah;
    för (la = wgah 1; Ia <= Nagl; Ia + +)
    if (mene [la] <mene [wgah])
    swap (mene, + + fhtagn, la);
    swap (mene, wgah, fhtagn);
    Rlyeh (mene, wgah, fhtagn-1);
    Rlyeh (mene, fhtagn 1, Nagl);

    } / / Fhtagn för Ph'nglui mglw'nafhCthulhu!

  • Hur konvertera e-postadresser i namn, ålder, etnicitet, sexuell läggning - Det här är så Meta - "Spara din e-postlista som en CSV-fil (bara med komma skilja dessa e-postadresser) Ladda upp denna fil till ditt Facebook-konto, som om du ville. lägga till dem som vänner. Voila, Facebook kommer att ge dig alla profiler för alla de användare (i mitt test, ungefär 80% av mina e-postlistor har Facebook-profiler). Nu, klicka dig igenom varje profil, och på grund av de nya standard facebook inställningar , vilket gör att allmänheten all information som är ungefär 95% av användarens information som finns tillgänglig för dig att skörda. "
  • Microsoft Security Development Lifecycle (SDL): Verktyg Repository - En samling av tidigare enbart intern säkerhetsverktyg från Microsoft, inklusive anti-XSS, fuzz-test, FxCop, hot modellering, binscope, nu tillgänglig för gratis nedladdning.
  • Analytics X Prize - Home - Prognos för mord i Philadelphia - The Analytics X Prize är en pågående tävling för att tillämpa analys, modellering, och statistik för att lösa de sociala problem som påverkar våra städer. Den kombinerar områdena statistik, matematik och samhällsvetenskap för att förstå de bakomliggande orsakerna till dysfunktion i våra bostadsområden. Att förstå dessa relationer och upptäcka de mest korrelerade variabler gör att vi kan utnyttja våra begränsade resurser på ett mer effektivt och rikta de variabler som har störst positiv inverkan på förbättring.
  • PeteSearch: Så hittar du användarinformation från en e-postadress - FindByEmail kod släppt som öppen källkod. Du passerar det en e-postadress, och det frågar 11 olika offentliga API: er för att upptäcka vilken information dessa tjänster har på användare med den e-postadressen.
  • Mätning Mått: Beyond Pagerank: Att lära med innehåll och nätverk - Slutsats: lärande baserat på innehåll och nätverksuppgifter är den nuvarande toppmoderna Det finns ett stort papper och prata om personalisering i Google Nyheter som de använder innehåll för detta ändamål, och sedan användaren klicka strömmar för att erbjuda personalisering, dvs rekommendera specifika artiklar inom varje aktuellt kluster. Frågan är innehållsfiltrering är normalt (som vi säger i forskning) "sätt hårdare." Anta att du har en social graf, en massa dokument, och du vet att vissa användare i den sociala grafen som vissa dokument och du vill rekommendera andra dokument som du tror att de kommer att gilla. Med hjälp av metoder som bygger på nätverk, kan du överväga att klustring användare baserat på co-visitaion (de har samar gillade några av de dokument). Detta skalar bra, och det internationalizes stor. Om du börjar utvinna funktioner från själva dokumenten, vad du bygger för engelska kanske inte fungerar så bra för den kinesiska marknaden. Dessutom finns det mycket mer data i texten än det finns i den sociala grafen
  • mikemaccana s python-docx till mästare - GitHub - MIT-licens Python-bibliotek för att läsa / skriva Microsoft Word docx-format. "Den docx-modulen läser och skriver Microsoft Office Word 2007 docx-filer. Dessa kallas" WordML "," Office Open XML "och" Open XML "av Microsoft. De kan öppnas i Microsoft Office 2007, Microsoft Mac Office 2008 OpenOffice.org 2.2, och Apple iWork 08. Modulen skapades när jag letade efter en Python stöd för MS Word. doc-filer, men kunde bara hitta olika hacks involverar COM automation, ringer. net eller Java, eller automatisera Openoffice eller MS Office. "

Bokmärken för 13 juni genom 16 januari

Detta är mina länkar för 13 juni genom 16 januari:

  • Starcraft AI Tävling | Uttrycksfull Intelligence Studio - AI bot krigföring konkurrens med hjälp av en hackad API för att köra Starcraft, kommer att hållas på AIIDE2010 i oktober 2010.
    Tävlingen kommer att använda Starcraft Brood War 1.16.1. Bots för Starcraft kan utvecklas med hjälp av Broodwar API, som ger krokar i Starcraft och möjliggör utveckling av anpassade AI för Starcraft. En C + +-gränssnitt gör det möjligt för utvecklare att fråga det aktuella läget av spelet och utfärda order till enheter. En introduktion till Broodwar API finns här. Instruktioner för att bygga en bot som kommunicerar med en fjärrprocess finns här. Det finns också ett forum. Vi uppmuntrar inlämning av robotar som använder sig av avancerad AI tekniker. Några idéer är:
    * Planering
    * Data Mining
    * Maskininlärning
    * Case-Based Reasoning
  • Mätning Åtgärder: Lär dig mer om statistisk inlärning - En "Quick Start Guide" för statistik-och maskinsystem lärande, bra samling av referenser.
  • Berkowitz et al: Användningen av formella metoder för att kartlägga, analysera och tolka Hawala och terroristrelaterade alternativa överföringssystem (2006) - Berkowitz, Steven D., Woodward, Lloyd H., & Woodward, Caitlin. (2006). Användning av formella metoder för att kartlägga, analysera och tolka Hawala och terroristrelaterade alternativa överföringssystem. Ursprungligen avsedd för publicering i att uppdatera 1988 års volym, eds, Wellman och Berkowitz, Sociala strukturer:. En nätverksstrategi (Cambridge University Press). Steve dog i november 2003. Se Barry Wellman s "Steve Berkowitz: Ett nätverk Pioneer har gått bort," i Anslutningar 25 (2), 2003. Det har inte varit möjligt att lägga till uppdateringen av referenser eller om kvaliteten på grafiken som skulle ha varit möjligt om Berkowitz levde. En tidig version av artikeln publicerades i Proceedings of the session om bekämpande av terroristnätverk: Current Research in Social Network Analysis för det nya kriget Fighting miljö. 8th International Command and Control Research and Technology Symposium. National Defense University, Washington, DC 17 till 19 juni, 2003
  • SSH Tunneling via webbfilter | s-anand.net - Steg för steg handledning om hur du använder Putty och en EC2 instans att inrätta en egen webbproxy på efterfrågan.
  • PyDroid GUI automation verktygslåda - GitHub - Vad är Pydroid?

    Pydroid är ett enkelt verktyg för att automatisera och scripting repetitiva uppgifter, speciellt de som involverar ett GUI, med Python. Den innehåller funktioner för att styra musen och tangentbordet, hitta färger och bitmappar på skärmen, samt visning plattformar varningar.
    Varför använder Pydroid?

    * Testa ett GUI ansökan om buggar och kantfall
    o Du kanske tror att din app är stabil, men vad händer om du trycker på den knappen 5000 gånger?
    * Automatisera spel
    o Att skriva ett manus för att slå det skit flash spel kan vara så mycket mer glädjande än att spendera timmar på att spela det själv.
    * Freaking vänner och familj
    o Tja kanske det är egentligen inte en praktisk användning, men ...

  • Time Series Data Library - Fler datamängder - "Detta är en samling av cirka 800 tidsserier hämtas från många olika fields.Agriculture Kemi Brott Demografi Ekologi Ekonomi Hälsa Hydrology Industry Arbetsmarknad Makroekonomi Meteorologi Mikroekonomi Diverse Fysik Production Sales Simulerad serien Sport Transport & Turism Tree-ringar Utilities "
  • Hur informativ är Twitter? »SemanticHacker Blog -.. "Vi genomförde en liten studie för att karakterisera olika typer av meddelanden som kan hittas på Twitter Vi hämtade ett urval av tweets under en tvåveckorsperiod med hjälp av Twitter streaming API Detta resulterade i en korpus med 8,9 miljoner meddelanden ("tweets") inlagt av 2,6 miljoner unika användare. Om 2,7 miljoner av dessa tweets, eller 31%, var svar på en tweet postat av en annan användare, medan en halv miljon (6%) var retweets. Nästan 2 miljoner (22 %) av de meddelanden som innehåller en URL-adress. "
  • Gremlin - en Turing-komplett, grafbaserade programmeringsspråk - GitHub - Gremlin är en Turing-komplett, grafbaserade programmeringsspråk utvecklat i Java 1.6 + för nyckel / värde-par multi-relationella grafer kallas fastighets grafer. Gremlin gör omfattande användning av XPath 1.0 språket för att stödja komplexa graftraverse. Detta språk har tillämpningar inom områdena graf fråga, analys och manipulation. Anslutningar finns för följande system datahanterings:

    * TinkerGraph in-minne grafen
    * Neo4j grafdatabas
    * Sesam 2,0 kompatibla RDF lagrar
    * MongoDB dokumentdatabas

    Dokumentationen för Gremlin kan hittas på denna plats. Slutligen, besök TinkerPop för andra mjukvaruprodukter.

  • The C Programming Language: 4,10 - efter Kernighan & Ritchie & Lovecraft - ogiltig Rlyeh
    (Int mene [], int wgah, int Nagl) {
    int Ia, fhtagn;
    if (wgah> = Nagl) avkastning;
    swap (mene, wgah, (wgah + Nagl) / 2);
    fhtagn = wgah;
    för (la = wgah 1; Ia <= Nagl; Ia + +)
    if (mene [la] <mene [wgah])
    swap (mene, + + fhtagn, la);
    swap (mene, wgah, fhtagn);
    Rlyeh (mene, wgah, fhtagn-1);
    Rlyeh (mene, fhtagn 1, Nagl);

    } / / Fhtagn för Ph'nglui mglw'nafhCthulhu!

  • Hur konvertera e-postadresser i namn, ålder, etnicitet, sexuell läggning - Det här är så Meta - "Spara din e-postlista som en CSV-fil (bara med komma skilja dessa e-postadresser) Ladda upp denna fil till ditt Facebook-konto, som om du ville. lägga till dem som vänner. Voila, Facebook kommer att ge dig alla profiler för alla de användare (i mitt test, ungefär 80% av mina e-postlistor har Facebook-profiler). Nu, klicka dig igenom varje profil, och på grund av de nya standard facebook inställningar , vilket gör att allmänheten all information som är ungefär 95% av användarens information som finns tillgänglig för dig att skörda. "
  • Microsoft Security Development Lifecycle (SDL): Verktyg Repository - En samling av tidigare enbart intern säkerhetsverktyg från Microsoft, inklusive anti-XSS, fuzz-test, FxCop, hot modellering, binscope, nu tillgänglig för gratis nedladdning.
  • Analytics X Prize - Home - Prognos för mord i Philadelphia - The Analytics X Prize är en pågående tävling för att tillämpa analys, modellering, och statistik för att lösa de sociala problem som påverkar våra städer. Den kombinerar områdena statistik, matematik och samhällsvetenskap för att förstå de bakomliggande orsakerna till dysfunktion i våra bostadsområden. Att förstå dessa relationer och upptäcka de mest korrelerade variabler gör att vi kan utnyttja våra begränsade resurser på ett mer effektivt och rikta de variabler som har störst positiv inverkan på förbättring.
  • PeteSearch: Så hittar du användarinformation från en e-postadress - FindByEmail kod släppt som öppen källkod. Du passerar det en e-postadress, och det frågar 11 olika offentliga API: er för att upptäcka vilken information dessa tjänster har på användare med den e-postadressen.
  • Mätning Mått: Beyond Pagerank: Att lära med innehåll och nätverk - Slutsats: lärande baserat på innehåll och nätverksuppgifter är den nuvarande toppmoderna Det finns ett stort papper och prata om personalisering i Google Nyheter som de använder innehåll för detta ändamål, och sedan användaren klicka strömmar för att erbjuda personalisering, dvs rekommendera specifika artiklar inom varje aktuellt kluster. Frågan är innehållsfiltrering är normalt (som vi säger i forskning) "sätt hårdare." Anta att du har en social graf, en massa dokument, och du vet att vissa användare i den sociala grafen som vissa dokument och du vill rekommendera andra dokument som du tror att de kommer att gilla. Med hjälp av metoder som bygger på nätverk, kan du överväga att klustring användare baserat på co-visitaion (de har samar gillade några av de dokument). Detta skalar bra, och det internationalizes stor. Om du börjar utvinna funktioner från själva dokumenten, vad du bygger för engelska kanske inte fungerar så bra för den kinesiska marknaden. Dessutom finns det mycket mer data i texten än det finns i den sociala grafen
  • mikemaccana s python-docx till mästare - GitHub - MIT-licens Python-bibliotek för att läsa / skriva Microsoft Word docx-format. "Den docx-modulen läser och skriver Microsoft Office Word 2007 docx-filer. Dessa kallas" WordML "," Office Open XML "och" Open XML "av Microsoft. De kan öppnas i Microsoft Office 2007, Microsoft Mac Office 2008 OpenOffice.org 2.2, och Apple iWork 08. Modulen skapades när jag letade efter en Python stöd för MS Word. doc-filer, men kunde bara hitta olika hacks involverar COM automation, ringer. net eller Java, eller automatisera Openoffice eller MS Office. "
  • Handy one-liners för SED - sed uttryck är kraftfulla, men något oklar och lätt att skruva upp. En praktisk lathund för vanliga uppgifter.

Bokmärken för 11 juni genom 12 juni

Detta är mina länkar för juni 11 via 12 juni:

Bokmärken för 9 juni genom 10 juni

Detta är mina länkar för 9 juni genom 10 juni:

Bokmärken för 6 juni genom 8 juni

Detta är mina länkar för 6 juni genom 8 juni:

  • Latinska motto generator: gör din egen catchy slogans! - Skapa dina egna livs motton och slagord på latin! (Learning latin krävs inte några vaga idéer för önskad motto ett plus)
  • En karta av sociala (Nätverk) Dominans - Med Alexa och Google Trenddata, Cosenza färgkodade kartan utifrån vilka sociala nätverk är den mest populära i varje land. Alla de ljusgröna länderna hör till Facebook. Men det finns fortfarande fickor av motstånd i Ryssland (där V Kontakte regler), Kina (QQ), Brasilien och Indien (Orkut), Centralamerika, Peru, Mongoliet och Thailand (hi5), Sydkorea (Cyworld), Japan (Mixi ), Mellanöstern (Maktoob) och Filippinerna (Friend).
  • Microsoft släpper Bing API - med några Användnings Kvoter - Uppdaterad sök-API, utan kvoter och en del förbättringar.
    * Utvecklare kan nu begära data i JSON och XML-format. SOAP-gränssnitt som Live Search API krävs också behållits.
    * Begärda uppgifter kan begränsas till en av följande källtyper: webb, nyheter, bilder, telefonbok, stavningskontroll, relaterade frågor, och Encarta direktsvar.
    * Det är nu möjligt att skicka förfrågningar i Opensearch-kompatibel RSS-format för webb, nyheter, bilder och telefonbok frågor.
    * Kund ansökningar kommer att kunna kombinera ett antal olika datakällor typer i en enda ansökan med en frågesträng.
  • Post Gränser Getting löjligt! «Verwon s Blogg - anekdotiska rapporter om Twitter-användare som kör på problem med hastighetsbegränsande, antingen API eller max inlägg / tweets / följer / leder.
  • Flot - Google Code - Flot är en ren Javascript rita bibliotek för jQuery. Den producerar grafiska tabeller för godtyckliga datamängder på-the-fly klientsidan. Fokus ligger på enkel användning (alla inställningar är valfria), attraktivt utseende och interaktiva funktioner som zoomning och spårning mus. Insticksprogrammet är känd för att arbeta med Internet Explorer 6/7/8, Firefox 2.x +, Safari 3.0 +, Opera 9.5 + och Konqueror 4.x +. Om du hittar ett problem, vänligen rapportera det. Teckning sker med duken tag introducerades av Safari och nu på alla större webbläsare utom Internet Explorer där excanvas Javascript emulering hjälpare används.

Bokmärken för 3 juni genom 4 juni

Detta är mina länkar för 3 juni genom 4 juni:

Bokmärken för 1 juni och med 2 juni

Detta är mina länkar för juni 1 genom 2 juni:

  • jqPlot - Ren Javascript Plotting - jqPlot är en plottning plugin för ramverket jQuery Javascript. jqPlot producerar vackra linje-och stapeldiagram med många funktioner, inklusive: Många diagram stil alternativ. Datum axlar med anpassnings formatering. Roterad axel text. Automatisk trendlinje beräkning. Verktygstips och datapunktmarkering. Vettiga standardvärden för enkel användning.
  • Ny Twitter Forskning: Män Följ Män och Nobody Tweets - samtalsämne - HarvardBusiness.org - "Även om män och kvinnor följer ett liknande antal Twitter-användare, män har 15% fler anhängare än kvinnor Män har också mer återgäldas relationer, där två. .. användare följer på varandra här "anhängare split" tyder på att kvinnor drivs mindre av anhängare än män, eller har strängare gränsvärden för återgående relationer Detta är spännande, speciellt med tanke på att kvinnor innehar en knapp majoritet på Twitter: Vi fann att män består 45% av Twitter-användare, medan kvinnorna utgör 55%. "
  • Shirky: Kraft Lagar, bloggar och Inequality - 2003 artikel om popularitet / trafik på bloggar, som då var den senaste framväxande sociala medier format. "När en kraft lag fördelning existerar, kan det ta en viss mängd homeostas,. Är tendensen av ett system för att behålla sin form även mot yttre tryck weblog världen ett sådant system? Finns det människor som är så begåvad och förtjänar som nuvarande stjärnor, men som inte får något liknande trafiken? Utan tvekan. Kommer detta problem förvärras i framtiden? Ja. "
  • väl formed.eigenfactor.org: Visualisera informationsflöde inom vetenskapen - Några trevliga visualiserings idéer med hierarkisk klustring att undersöka mönster i stämning nätverk.
  • Bing API, version 2.0 - Uppdaterat API-dokumentation för Microsoft Bing (tidigare Live Search) webbtjänster.

Bokmärken för 29 maj 5:17 till 12:45

Detta är mina länkar för Maj 29 5:17 till 00:45:

Bokmärken för 24 maj genom 27 maj

Detta är mina länkar för 24 maj genom 27 maj:

  • Formler och spelmekanik - SvWoWWiki - Din guide till World of Warcraft - Formler och spelmekaniska regler och riktlinjer för att utveckla rollspel
  • Manchester Uniteds Park Har Endurance att hålla ut - NYTimes.com - koreanska fotbollsspelare Park Ji-Sung - På onsdag kväll i Rom, är Park väntas bli den första asiatiska spelare att delta i den europeiska Champions League-finalen när Manchester United möter Barcelona.
  • mloss.org - Maskininlärning Open Source Software - Stor samling av öppen källkodspaket för maskininlärning, data mining, statistisk analys
  • Datacenter som Computer - Luiz André Barroso och Urs Hölzle 2009 (PDF) - 120 sidor om storskaliga datorlektioner från Google. "Dessa nya stora datacenter är helt annorlunda från traditionella hosting anläggningar av äldre tider och kan inte ses enbart som en samling av co-placerade servrar. Stora delar av hårdvara och mjukvara resurser i dessa anläggningar måste arbeta tillsammans för att effektivt leverera goda nivåer av Internet-prestanda, något som endast kan uppnås genom en helhetssyn på deras design och distribution. Med andra ord måste vi behandla datacenter sig som en stor lagerlokal skala dator (WSC). Vi beskriver arkitekturen i WSCs, huvud faktorer som påverkar deras konstruktion, drift och kostnadsstruktur, och egenskaperna hos deras programvara bas. "
  • Geeking med Greg: Datacentret är den nya stordatorn - Pointer till en uppsats av Googles medarbetare Luiz Andre Barroso och Urs Hölzle på utvecklingen av lager skala databehandling och förvaltningen och användningen av datorresurser i modern datacenter.

Bokmärken för 22 maj genom 23 maj

Detta är mina länkar för 22 maj genom 23 maj:

  • Förbättra MySQL Insert Performance - Sammanfattning - använd LOAD DATA INFILE
  • Scratch | Hem | föreställa sig, program, dela - är Scratch utformad för att hjälpa unga människor (åldrar 8 och uppåt) fram 21: a århundradet inlärningsförmåga. När de skapar och dela Scratch projekt, ungdomar lära sig viktiga matematiska och beräknings idéer, samtidigt som att lära sig att tänka kreativt, orsak systematiskt, och samarbeta
  • Alice.org - Programmeringsspråk miljö för undervisning barn, byggd på Java, inriktad mot en berättande strategi.
  • Jason R Briggs | Snake Wrangling för barn - "Snake Wrangling för barn" är en tryckbar elektronisk bok, för barn 8 år och äldre, som vill lära sig programmering. Det omfattar det mest grundläggande i programmering, och använder programmeringsspråket Python 3 för att lära begreppen.
  • Benchmarking BDB, CDB och Tokyo Cabinet på stora datamängder - CDB kommer ut betydligt snabbare. (Det är för oföränderliga uppgifter om, så inte helt förvånande) Benchmark uppgifter för 11M nyckel-värde-par dataset som lagras i Berkeley DB, CDB, och Tokyo Cabinet.

Bokmärken för 22 maj 6:31 till 07:14

Detta är mina länkar för Maj 22 6:31 till 07:14:

  • Javascript Malware Analys: En fallstudie . - "Just den här besten hittades i vilt tillstånd i maj 2009 om en plats phishing för Facebook-användaruppgifter, och är en särskilt-otäck jävel Notera antalet konstigt namngivna variabler som skapats på framsidan, många som inte ens nämns i de kodblock som följer. Dessutom märker de udda ternära uttalanden som inte påverkar driften av koden, och antagligen måste finnas för att resa upp skannrar (om det inte finns en finare form av strängbyte på kropp av vissa funktioner, i vilket fall de funktioner kunde muterade före avrättningen -., och som skulle vara skrämmande Ett chiffer bygger på kroppen av den funktionen har också sett) ".
  • MySQL: Forked går att reparera? | Developer World - Infoworld - Nu när MySQL är en del av Oracle, kommer gafflarna tar över? "Om MySQL: s godkännande betyg är slumping, desto större anledning för Oracle att gå beslutsamt. Oracle måste arbeta för att återvinna förtroende och stöd för MySQL samhället eller riskerar att förlora Mindshare på en gaffel, såsom Ringla eller MariaDB. För att göra det, det måste undvika att göra de misstag som Sun gjort när de förvärvade MySQL. På ett sätt att lyckas med MySQL, kommer Oracle måste sluta agera som Oracle. "
  • Scott Hanselman Computer Zen - Mindre Virtual, Mer Machine - Windows 7 och magin i Boot till VHD - Anmärkningar om du använder Windows virtuella hårddiskar för att hantera fall av multipel version av Windows parallellt, t.ex. Windows 7 beta, WinXP, etc.
  • Hur Operas affärsmodell fungerar - Communication Breakdown - David Meyer blogg på ZDNet.co.uk Community - Omkring 40M användare, "De flesta av våra intäkter - 75-80 procent -. kommer från mobila enheter, fom en gratis webbläsare Vi tillhandahåller webbläsaren för gratis, liksom Opera skrivbordet och Mini, och sedan vi skapa inkomster från våra innehållspartners. Vi ger en sökning i det högra hörnet och sånt, och som genererar intäkter i de fria distributioner. Sedan får betalt av OEM-tillverkare [tillverkare av originalutrustning ] för distribution -.. företag som Nokia och Motorola flesta av de mobila OEM och en hel del av de andra OEM Vi skrev Ford nyligen och vi är nu i Ford lastbilar ".
  • Digicorp »Blog Archive» Förebyggande av SQL-injektion med PHP - Anmärkningar om god kodning hygien för att undvika SQL-injektion attacker vid bearbetning webbformulär ingång som lösenord och andra textfält.

Bokmärken för 19 maj 8:04 till 19:24

Detta är mina länkar för Maj 19 8:04 till 19:24:

  • Lista över Riktigt Användbara Gratis verktyg för JavaScript utvecklare | W3Avenue -
  • När koreanska kulturen blomstrade - WSJ.com - I geografin i Metropolitan Museum of Art, galleriet ägnas åt Korea fungerar som en slags bro mellan Kina och Sydasien som alltför ofta fungerar som passage snarare än destination. Den första i en serie utställningar som ska hållas under de närmaste 10 till 15 åren, "Konst av den koreanska renässansen, 1400-1600" kan ändra på detta. Med endast 47 objekt (!), Utforskar utställningen en bördig 200-årsperiod i Korea kulturhistoria, avslöjar så mycket genom sitt val av verk som den gör genom den ordning som då visas. Showen blygsamma storlek gör den punkt att, tyvärr, lite har överlevt från denna tid, då Joseon - eller Fresh Dawn - dynastin (1392-1910) förenade den koreanska halvön militärt, etablerat konfucianismen som nationell ideologi och införde ett fonetiskt alfabet.
  • Axiis: Data Visualization Framework - Axiis ger både pre-byggda visualiseringskomponenter samt abstrakta layoutmönster och rendering klasser som du använder för att skapa dina egna unika visualiseringar. Axiis bygger på grafik ramverket Degrafa och Adobe Flex 3.
  • Rapport: Mint anser Selling anonymiserade data från sina användare - ReadWriteWeb - Många människor skulle vara intresserade av att datasetet. Knepigt att balansera exponeringsdata med konsumenternas integritet.
  • Lendingclub.com: En De-anonymisering Walkthrough «33 Bitar av Entropy - Steg för steg titta på de-anonymisera en konsument datamängd. Med tanke på alternativa källor, kan du fylla i en hel del brister.

Bokmärken för 14 maj genom 15 maj

Detta är mina länkar för maj 14 till maj 15: e:

  • Grattis, Google personal: $ 210k i vinst per invånare under 2008 | Kungliga Pingdom - Google hade $ 209.624 i vinst per anställd år 2008, vilket slår alla de andra stora teknikföretag som vi tittat på, inklusive stora hitters som Microsoft ($ 194K), Apple (151K $), Intel ($ 64K) och IBM (30K $).
  • Statistiska Data Mining Tutorials - En trevlig samling av presentationer granska ämnen inom datautvinning och maskininlärning. t.ex. "hillclimbing, simulerad frysning och genetiska algoritmer. Några mycket användbara algoritmer, för att endast användas i nödfall." Dessa inkluderar klassificeringsalgoritmer såsom beslutsträd, neurala nät, Bayesian klassificerare, Support Vector Machines och kapslade-baserade (aka icke-parametrisk) lärande. De omfattar regressions algoritmer såsom multivariat polynom regression, MARS, Lokalt Vägt Regression, GMDH och neurala nät. Och de innehåller andra data gruvverksamhet såsom klustring (blandningsmodeller, k-medel och hierarkisk), Bayesianska nätverk och Reinforcement Learning.
  • Dare Obasanjo aka Carnage4Life - Varför Twitters Ingenjörer hatar @ svar har - Om man tittar på overhead som krävs för Twitters försök till förändring till @ svara beteende infrastruktur.
  • Scratch hjälper barnen få med programmet - Gadgetwise Blog - NYTimes.com - På min kandidatlista för årskurs 7 inledande programmering och analys. "Scratch, en MIT-utvecklade dator programmeringsspråk för barn, är i fokus för världen visa-och-berätta sessioner på lördag."
  • jLinq - Javascript Query Language - För att manipulera datauppsättningar i Javascript, ungefär som jQuery

Bokmärken för 13 maj 6:26 till 22:36

Detta är mina länkar för Maj 13 6:26 till 22:36:

Bokmärken för 12 maj 10:52 till 21:56

Detta är mina länkar för 12 maj 10:52 till 21:56:

Bokmärken för 8 maj genom 12 maj

Detta är mina länkar för 8 maj genom 12 maj:

Bokmärken för 6 maj genom 7 maj

Detta är mina länkar för 6 maj genom 7 maj:

Bokmärken för 5 maj via 6 maj

Detta är mina länkar för 5 maj via 6 maj:

2 3 Sida 1 av 3 1 2 3