| site-ul admin | 12 iunie 2009 | Comentarii sunt închise Acestea sunt link-urile pentru 11 iunie până în 12 iunie: site-ul admin | 23 aprilie 2009 | Comentarii sunt închise Acestea sunt link-urile pentru 20 aprilie, prin 23 aprilie: - Ceea ce am învățat de la Hacker News - Paul Graham pe dinamica socială și gestionarea Hacker News, a prezentat utilizator comentarii și trafic (vot sus / jos), intervenția editorială și moderatorii, obiectivele proiectului.
- SEOmoz | Reddit, StumbleUpon, Del.icio.us și Hacker Algoritmi expuse! - Privind la variatii pe algoritmi de elemente clasament pe agregatoare de știri sociale
- Nginx + PHP-FPM + APC = Awesome - Walkthrough privind înființarea cache server web PHP pe Nginx cu APC.
- Particletree »PHP rapid Profiler - instrument ușor de profilare cod PHP.
- Formule full-text MySQL - Baza de date de jurnal -
- http://www.acapela-group.com/text-to-speech-interactive-demo.html - Online demo de text-to-speech, cu diverse difuzoare de sex masculin și feminin, plus o câteva traduceri.
- Confruntarea cu date personale Duplicate - Mandri de a folosi Perl - Clasificarea probabil intrări duble în nume / adresă datele de contact utilizând Levenshtein distanță și tabele de sinonim nickname si greutati distanță atribuite.
- Web Security povești de groază: Cut directorului de la <head> - slide-uri de prezentare de la o discuție de Simon Willison pe cruce site scripting, SQL injection, referer fals, și Clickjacking atacuri asupra aplicatiilor web.
site-ul admin | 10 aprilie 2009 | Comentarii sunt închise Acestea sunt link-urile pentru 09 aprilie, prin 10 aprilie: - Codificare Horror: Sex, Lies, si dezvoltarea software - Există locuri de muncă de programare nu s-ar lua? Nu pentru că locurile de muncă nu a plătit destul, a avut beneficii sărace, în sensul creșterii sau limitat - dar pentru că munca în sine a făcut să te simți prost? - Un comentariu fir lung cu privire la etica și problemele sociale din jurul lucru pentru site-urile porno vs alți angajatori.
- Fireball Daring: Cum de a bloca DiggBar - Pe shorteners URL și blocarea DiggBarr de încadrare pagini țintă.
- Cum mi-am pierdut 50 lbs cu noul Twitter API - Și acum totul e asta - cu privire la modificările de punere în aplicare necesare pentru a actualiza o aplicație client Twitter (Dr. Twoot) la cele mai recente API
- 10 lucrări va trebui să citiți | Știință pentru SEO . - "Aceasta este o listă de top 10 hârtiile mele disponibile gratuit pe tema de regăsirea de informații, veți observa că acestea sunt destul de vechi, dar tehnicile utilizate descrise și rezultatele nu sunt întotdeauna datat. Cei care data sunt importante toate acestea, deoarece acestea oferă o bază bună pentru a înțelege de ce lucrurile sunt așa cum sunt în extragerea de informații în aceste zile ".
- Isus blinched (sau: De ce iubesc Joia Mare) - Posterous fistic lui - "ceea ce rămâne cu mine la această zi este umanitatea abjectă a lui Isus în povești de Cina cea de Taină, trădarea, negarea și mai presus de toate, în Ghetsimani."
Am observat că instalarea mea WordPress a fost spart de spam motor de căutare atac de injectare cândva în ultimele câteva săptămâni. Acest lucru special, una introduce text invizibil, cu o mulțime de cuvinte cheie în footer.php. Modificările la dosar au fost făcute utilizând editorul tema built-in, originare din ns.km20725.keymachine.de, care este în prezent la 84.19.188.144. Campania de spam actualizează automat utilă de spam în fiecare zi sau cam asa ceva. Link-urile indica o varietate de servere care au fost, de asemenea, sparte pentru a găzdui conținut spam. Iată o mostră: http://www.nanosolar.com/feb3/talk.php?28/82138131762.html I-am trimis un e-mail la Nanosolar, astfel încât acestea vor avea, probabil, că conținut curățate înainte de lung. Dar SEO actualizările automate de campanie de spam de cuvinte cheie și link-ul de utilă în mod regulat, astfel încât orice site-uri afectate WordPress vor fi actualizate la punctul de la noile victime hosting. De la o verificare rapidă pe Google, se pare ca keymachine.de este un infractor obișnuit Interogarea de căutare de date pe care America Online postate peste week-end a fost eliminat de pe site-ul lor după un viscol de mesaje cu privire la probleme de confidențialitate. AOL ceea oficial acest lucru ca pe "un șurub în sus" , potrivit purtatorul de cuvant Andrew Weinstein, care au răspuns la un comentariu pe mai multe site-uri: Toate - Acest lucru a fost un șurub în sus, iar noi suntem furios și supărat despre asta. A fost o încercare destul de nevinovat pentru a ajunge la comunitatea academică cu noi instrumente de cercetare, dar, evident, nu a fost verificat în mod corespunzător, și dacă ar fi fost, ar fi fost oprit într-o clipă. Deși nu există date de identificare personală legate de aceste conturi, nu suntem absolut apărarea aceasta. A fost o greșeală, și ne cerem scuze. Am lansat o investigație internă în ceea ce sa întâmplat, și ne iau măsuri pentru a se asigura că acest tip de lucru se întâmplă niciodată.
Am tras în jos o copie a datelor ultima noapte înainte link-ul a scăzut, dar nu ajunge în jurul valorii de fapt în căutarea peste până în această seară. Într-o privire casual la secțiunile aleatorie a datelor, am vedea o surprinzătoare (pentru mine) numărul de persoane tastarea în URL-uri complet, o serie de întrebări legate de sex, (unele dintre care eu nu înțeleg de fapt), cumpărături legate de interogări, interogări celebritate legate, și o mulțime de ceea ce arata ca proiectele teme de liceu sau studenti. În același timp, multe alte persoane au găsit înregistrări interesante / problematică dintre datele, inclusiv numărul probabile de securitate socială, numere de permis de conducere, adresele și alte informații personale. Iată o listă de întrebări despre cum a ucis soția ta de schimbare de paradigmă. Mai multe probe culese de la datele de aici , aici și aici . # 479 Se pare ca un student de la Universitatea de Stat din Prairie, care place sa joc EA Sports Baseball 2006, este un fan White Sox, și a fost de planificare pentru a merge la Ozzfest. Când nimic altceva nu se întâmplă, îi place sa ma uit la Nip / Tuck. # 507 îi place să negocieze de pe eBay, este în vânătoare fantoma, conduce în prezent un 2001 Dodge, dar planurile pe obtinerea unui Mercedes. De asemenea, el locuieste in zona Detroit. # 1021 este șomer și locuiește în New Jersey. Dar asta nu-l dau jos, deoarece cu timpul său nou găsit, el va ajunge în cele din urmă pentru a vedea Sixers. # 1521 ca porno gratuit.
Bazat pe propriile mele căutare eclectice, aș fi reticente în a deduce intenția specifică bazată doar pe o serie de interogări de căutare, dar este încă interesant, încurcat, și, uneori tulburător pentru a vedea grupuri de întrebări care apar în datele. Până în acest moment, în scopul de a avea un bun set de date de comportament interogarea utilizatorului, ai, probabil, nevoie pentru a lucra pentru una dintre cele mai mari motoare de căutare, cum ar fi Google sau Yahoo (sau, poate, o companie de marketing spyware sau on-line). Eu încă mai cred că schimbul de date a fost bine-intentionate în spirit (deși a ratat de afaceri masiv). Sav, comentând pe la TechCrunch (# 67) observă: Partea amuzantă aici este faptul că cercetătorii, obișnuiți să caute la date, cum ar fi acest lucru in fiecare zi, am dat seama ca ai putea identifica persoanele cu interogările de căutare. (De ce ai vrea să faci asta? Avem screenname toată lumea. Ne vom ascunde doar cele pentru date publice.), Cele mai mari descoperiri din cercetare se întâmplă întotdeauna de accident ...
O problemă mai largă în contextul vieții private este că toate aceste informații și mai multe sunt deja colectate in mod obisnuit de către motoarele de căutare, de căutare bare de instrumente, asortate desktop widget / pointer / spyware de download-uri, site-uri de cumpărături on-line, etc nu cred că cei mai mulți oameni au internalizat cât informații cu caracter personal de mult și date comportamentale este deja acolo, în depozite de date private. Cele mai multe ori va trebui să plătească ceva pentru a ajunge la ea, totuși. Mă aștept să văd pepite mai interesant exploatat de date de interogare, iar unele viguros dezbatere de politică în ceea ce privește colectarea și schimbul de gesturi atenție personală , cum ar fi interogări de căutare și clicuri link-ul din zilele următoare. A se vedea, de asemenea: AOL cercetare publică 20 de milioane de interogări de căutare Update 08-08-2006 05:58 PDT - prima interfață on-line pentru a explora datele interogările de căutare AOL este de până la www.aolsearchdatabase.com (via TechCrunch ). Update 08-08-2006 14:18 PDT - Aici este o altă interfață on-line la dontdelete.com (prin Lacomia infectioasa ) Actualizare Miercuri 08-09-2006 19:14 PDT - un profil al utilizatorului 4417749, Thelma Arnold , o văduvă de 62 de ani, care locuieste in Lilburn, GA, împreună cu o discuție a bazei de date interogare AOL în New York Times. Mai multe date brute pentru ingineri de căutare și SEO, și furajere pentru dezbateri confidențialitate online - AOL Research a lansat o colectie de aproximativ 20 de milioane de interogări de căutare care includ toate căutările efectuate de o selectate aleatoriu set de aproximativ 500.000 de utilizatori de la martie-mai 2006. Acest lucru ar trebui să fie un mare set de date pentru a lucra cu dacă faci cercetare pe motoarele de căutare, dar se pare problematică din perspectiva confidențialității. Datele sunt anonime, astfel încât numele de utilizator AOL sunt înlocuite cu un ID de utilizator numerică: Setul de date cuprinde {UserID, interogare, QueryTime, ClickedRank, DestinationDomainUrl}.
Bănuiesc că ar putea fi posibil pentru a inversa inginer parte din grupuri de interogare pentru a identifica anumiți utilizatori sau alte date personale. Dacă nimic altceva, am observa ocazional de persoane tastarea accidental în nume de utilizator sau parole în casetele de căutare, astfel încât nu sunt susceptibile de a fi unele dintre cele în amestec. "Anonim", în comentariile de peste la blog-ul Greg Linden crede că va exista o multime de cei. URL-urile de destinație pare că au fost tăiate la fel de bine, așa că nu va fi capabil pentru a vedea pagina exact care a dus la un click-through. Nu au luat o privire la datele reale încă, dar mă bucur că nu sunt un utilizator AOL. Adam D'Angelo spune : Acest lucru este aceleași date pe care Departamentul de Justiție vrut de la Google în luna martie. Această hotărâre a permis Google să păstreze secretul toate jurnalele de interogare. Acum, orice guvern poate merge pur și simplu descărca datele de la AOL.
Pe partea cererii de căutare, acesta este un aspect rar la comportamentul real de căutare a utilizatorilor, care ar fi dificil de obținut fără acces la un motor de cautare de mare de trafic sau, eventual, printr-un serviciu plătit. Plentyoffish vede o oportunitate pentru autorii de spam PPC și AdSense :
Google / AOL au dat doar câteva dintre cele mai mari spam lumi o defalcare a termenilor de mare trafic de doar o chestiune de săptămâni până când Google devine mega afectați de spam de făcut pentru site-urile AdSense și alte tipuri de site-uri de spam cuvinte cheie ca tinta incluse în această listă.
Cred că e minunat că AOL este încercarea de a deschide mai mult și să se angajeze cu comunitatea de cercetare, și se pare că există câteva alte colecții de date interesante pe site-ul de cercetare AOL - dar bănuiesc că sunt pe cale să ia o mulțime de căldură pe fata de confidențialitate, judecând din amestec de reacțiile inițiale pe Techmeme. Sper că nu-i speria și vor găsi o modalitate de a publica datele de cercetare utile fara a provoca un dezastru intimitate. Mai mult de unghiul de intimitate din SiliconBeat , Zoli Erdos A se vedea, de asemenea: În curând la DVD - 1146580664 comune secvențe de cinci cuvinte Update - Duminica 08-06-2006 20:31 PDT - AOL Cercetare pare să fi luat în jos anunțul și datele din jurnal în ultimele câteva ore, ca răspuns la un număr tot mai mare de posturi pe blog , mai ales critice, iar cea mai mare parte axat pe intimitate. Markus la Plentyoffish asemenea, a folosit datele pentru a genera o listă de cuvinte cheie de căutare ton de apel pe care utilizatorii clic prin intermediul la un site ton de apel ca un exemplu de modul în care aceste date pot fi folosite de SEO și spam-ul de marketing. Se pare ca problemele de confidențialitate sunt de gând pentru a obține cele mai timpi de antenă, chiar acum, dar cred că datele de clic de cuvinte cheie va avea efectul cel mai imediat. Actualizare Luni 08-07-2006 08:02 PDT: Unele oglinzi de date AOL Unele week-end amendă de lectură pentru ingineri de cautare, SEO, și operatorilor de rețele de spam: Un raport independent de 47 de pagini pe Google AdWords / AdSense faceți clic pe fraudă, a depus ieri, ca parte a unui litigiu între Lane Cadouri și Google, oferă o imagine de ansamblu mare a istoriei și starea actuală de fraudă faceți clic, clicurile nevalide de toate tipurile, și Procesul de patru straturi de filtrare care Google folosește pentru a le detecta. Google a construit următoarele patru "linii de apărare" împotriva clicurilor nevalide: pre-filtrare, filtrare on-line, de detectare a deconectat automat și de detectare a deconectat manual, în această ordine. Google implementează diferite metode de detectare în fiecare dintre aceste etape: abordările bazate pe reguli și anomalie bazată pe pre-filtrare și etapele de filtrare, o combinație a tuturor celor trei abordări în faza automat de detectare a deconectat, și abordarea anomalie bazate pe în offline etapa de control manual. Această implementare de metode diferite în diferite stadii oferă Google posibilitatea de a detecta clicurile incorecte utilizând tehnici alternative și, astfel, crește șansele lor de a detecta mai multe clicuri nevalide într-una dintre aceste etape, preferabil în mod proactiv în stadii incipiente.
O observație interesantă este că cele mai multe click fraudă pot fi eliminate prin filtre simple. Alexander Tuzhilin , autor al raportului, speculează pe o Zipf-lege coada lunga de clicuri nevalide de atacuri mai putin frecvente, și observă:
În ciuda performanțelor sale rezonabil actuală, această situație se poate schimba în mod semnificativ în viitor, în cazul în care noi atacuri se va deplasa spre coada lunga de distribuție Zipf de ce în ce mai sofisticate și diversă. Acest lucru înseamnă că efectele lor vor fi mult mai proeminent în comparație cu situația actuală și că actualul set de filtre simple, implementate de către Google nu poate fi suficientă în viitor. Inginerii Google recunoaște că acestea trebuie să rămână vigilente față de noi tipuri posibile de atacuri și sunt în prezent lucrează la filtrele de generație următoare pentru a aborda această problemă și pentru a rămâne "înainte de curba" în lupta nesfârșită a detecta noi tipuri de clicuri incorecte.
El subliniază, de asemenea, ireductibil problema de fraudă faceți clic într-un model de PPC: - Faceți clic pe fraudă și clicuri incorecte poate fi definită conceptual, dar defintion lucru este doar o operațional definit unul
- Definiția operațională de clicuri invalide nu pot fi pe deplin divulgate publicului larg, deoarece aceasta va duce la frauda click masive.
- Dacă definiția operațională nu este dezvăluită într-o anumită măsură, agenții de publicitate nu poate verifica sau contesta ce au fost taxat pentru anumite clicuri
Așezarea Curtea solicită o evaluare independentă dacă eforturile Google de a combate frauda click sunt rezonabile, care Tuzhulin crede că sunt. Întrebarea mai interesantă este dacă ei vor continua să fie suficient, progrese timp si coada lunga de fraudă faceți clic se extinde. Link-uri: În ultimele seri am fost de lucru printr-o copie reexaminare a PageRank și Dincolo de Google , prin Amy Langville și Carl Meyer . Spre deosebire de unele cărți recente pe Google, acest lucru nu este exact o citire ușoară și angajarea de vară. Cu toate acestea, dacă aveți un interes în algoritmii de căutare, matematică aplicată, optimizarea motorului de căutare, sau au în vedere construirea de motorul de căutare propriu, aceasta este o carte pentru tine. Elevii de căutare și informații literatura de recuperare poate recunoaște autorilor, Langville și Meyer, de la hârtie de revizuire, adanc in interiorul PageRank . Noua lor carte extinde pe materiale supuse tehnică în original pe hârtie, și adaugă numeroase anecdote și observații în numeroase laterale în întregul text. Notele laterale oferă un context istoric practice, sociale, iar recent pentru matematica a fi prezentate, inclusiv subiecte cum ar fi "PageRank și Link spamming", "Cum Motoare de căutare face bani?", "SearchKing vs Google", și o trimitere la Jeremy Zawodny lui PageRank este mort mesaj. Există, de asemenea, un cod Matlab probă și indicii la resurse web legate de motoarele de căutare, algebra liniară, și implementări pe șenile. (Aspiră constructor motor de căutare va dori să exploreze unele dintre aceste resurse și în altă parte pentru a afla despre crawlerele web și de calcul la scară largă, care nu este scopul aici.) Aceasta carte ar putea servi drept o excelenta introducere pentru a căuta algoritmi pentru cineva cu o programare sau matematica fundal, care acoperă PageRank la lungime, împreună cu unele discuții de hit-uri, salsa, și abordări antispam. Unele teme actuale, cum ar fi clustering, personalizare, și reputația (TrustRank / SpamRank) nu sunt acoperite aici, deși acestea sunt menționate pe scurt. Bibliografia și resursele web oferă o listă sursă completă de cercetare suplimentare (până prin jurul 2004), care va ajuta cititorii motivate punct în direcția cea bună. Sunt sigur că va fi popular la Google și Yahoo, și, probabil, la diverse agenții de SEO, de asemenea. Cei cu mai puțin interes în măruntaiele a tehnologiei de cautare se pot bucura de o vară mai casual citit despre Google, incercati John Battelle este Căutare . Sau pentru a obține Langville și carte Meyers, săriți de matematica, și doar citi laterale. A se vedea, de asemenea: o listă de lectură pe PageRank și Algoritmi de căutare , link-urile mele del.icio.us pe algoritmi de căutare 
Se pare ca cineva a lansat un nou referent campanie de spam în prezent, există o uptick imens în trafic aici. Cererile primite sunt de la peste tot pe internet, probabil de la un botnet de computere deturnate, dar se pare ca tot din punctul de link-uri la o rețea de clasă C la 85.255.114 undeva în Ucraina. Este interesant să ne gândim un pic despre campaniile de spam link-ul și ce oportunitate de operatorii spera sa exploateze. Două tipuri majore de spam link-ul pe blog-uri sunt spam de comentariu și trimit mesaje nedorite. Percepția mea este că comentariu spam-ul este mult mai comun. Cele mai multe bloguri și încheie acum link-uri de ieșire din comentarii cititor cu "rel = nofollow" pentru a preveni comentarii Linkuri de creștere rang Google pentru elementele legate, dar link-uri sunt încă acolo pentru oameni să faceți clic pe. Referrer spam-ul este mai mult indirect. Acesta este creat de a face o cerere HTTP cu antetul Referer stabilit la URL-ul promovat. Cele mai multe ori, acest lucru va fi vizibil în jurnalul de serverul de web numai. Aici este o intrare tipic jurnal HTTP:
87.219.8.210 [04/Feb/2006: 15:20:35 -0800] GET / HTTP/1.1 weblog/archives/2005/09/15/google-blog-search-referrers-working-now 403 - "http:/ / fiecare-search.com " Unele bloguri și alte site-uri web publica o listă generată automat de "referenți recente" de pe pagina lor de origine sau de pe o bara laterală. În condiții normale de utilizare, acest lucru ar arăta o listă de site-uri care au legătură cu site-ul vizualizat. Listele recente referrer sunt mai puțin frecvente în prezent, din cauza creșterii de trimit mesaje nedorite. Referrer spam-ul va arăta, de asemenea, în statistica site-ul web și rezumate de trafic. Acestea sunt, de obicei, privat, dar sunt lăsate, uneori, deschis pentru public și pentru motoarele de căutare. Unul dintre obiectivele prezumată a unei campanii de spam link-ul este de a crește motor de căutare ranking site-țintă. În general, acest lucru necesită construirea o colectie de link-uri valide inbound, de preferat fără atributul "nofollow". Referrer spam-ul poate fi mai eficient pentru a genera inbound link-uri, deoarece listele de referrer recente și rapoartele de site-ul web de obicei, nu pot fi încadrate legăturile lor cu nofollow. Paginilor de destinație pentru link-urile din această campanie sunt interesante în care acestea nu conțin publicitate, la toate. Acest lucru sugerează că această campanie este încercarea de a construi un fel de PageRank fermă de a promova ceva. Paginile reale sunt toate construite pe același șablon blog, și conțin o combinație de păsărească și link-uri bara laterală pentru subdomenii bazate pe cuvinte cheie "de valoare". Utilizând formatul de blog-ul oferă în mod automat o mulțime de interconectare site-ului, și ei au, de asemenea, "de top referer" liste "recent" și, care sunt toate de la alte site-uri de spam în rețea. Se pare ca textul conținut ar trebui să fie ușor de identificat ca spam-ul bazat pe analiza de frecventa. Având probabil un nor foarte mare de site-uri spam-ul care leagă unul de altul, împreună cu un set dispersate de intrare spam de link-uri face site-uri arata mai plauzibil pentru un motor de căutare? Aceste site-uri nu par să aibă nici o, dar am venit peste alte site-uri de spam și comenta mesaje spam care au link-uri către site-uri non-spam, cum ar fi. Gov și. Site-edu, probabil, încercând să caute mai credibilă pentru un motor de căutare ranking algoritm. Toate site-urile fiind în aceeași subrețea le face mai ușor de la fața locului, deși. Având în vedere că nu sunt atât de multe site-ul pagini publice statistica web și liste recente referrer în jurul, eu sunt surprins că referrer spam-ul este merită efortul. Dacă rețeaua spam-ul poate obține clasament bun in Google si alte motoare de căutare, ele pot stimula probabil clasament de un site țintă selectat prin tăiere înapoi o parte din legăturile lor inițiale și adăugarea unor link-uri la site-urile care doresc să promoveze. Link-uri afiliate la pornografie, jocuri de noroc, sau site-uri de farmacii online trebuie să plătească destul de bine pentru a lucra pentru spam. Mai multe lectură: O listă de referințe cu privire la PageRank și de detectare a spam-link . Dacă aveți probleme spam de pe site-ul dvs., puteți găsi mei note la blocarea referer spam-ul util. Iată o probă textul de la "search-buy.com":
I căutare-cumpărare de cel și și următorul tren. Ne astfel la cruzime căutare-cumpărare în după anestezie generală dificultate la urinare. Produse de patiserie T un ben pentru băiat căutare-cumpărare. O refuză excursie căutare-cumpărare romanele părea Azusa Pacific ca universitate. Stoc a mea este și căutare-cumpărare cu Titans directe Teen sex. Kid philadelphiaa ar fi și New York căutare-cumpărare. G căutare-cumpărare purtat vărsat i tati. obstacolele viitor dreapta căutare-cumpărare avut satiră al XIX-lea. Care i UPS acest lucru pe căutare-cumpărare cel găsește audio Express Richmond. au această fereastră fost minunat mi căutare-cumpărare așa. Surel în fapt de căutare cumpere băiatul nostru profunde noțiuni franklin. IT căutare-cumpărare de a mea de. Pentru la băiat cap că o căutare-buy. O james căutare-cumpărare de peste tot, dar. Alread provin căutare-cumpărare bun de atunci.
Iată câteva site-uri de spam din această campanie și adresele lor IP:
bikini-now.com A 85.255.114.212
babestrips.com Un 85.255.114.229
căutare-biz.biz A 85.255.114.245
bustytart.com Un 85.255.114.250
cjtalk.net Un 85.255.114.227
căutare-galaxy.org A 85.255.114.252
moresearch.org Un 85.255.114.237
Aici este WHOIS pentru că netblock:
% Informatii privind '85 .255.112.0 - 85.255.127.255 "
inetnum: 85.255.112.0 - 85.255.127.255
NetName: inhoster
descr: Inhoster companie de găzduire
descr: OOO Inhoster, Poltavskij Shliax 24, Kharkiv, 61000, Ucraina
Observații: -----------------------------------
Observații: notificări abuzuri: abuse@inhoster.com
Observații: Probleme de rețea la: noc@inhoster.com
Observații: peering cereri pentru: peering@inhoster.com
Observații: -----------------------------------
țară: UA
org: ORG-EST1-RIPE
admin-c: AK4026-RIPE
Tech-C: AK4026-RIPE
Tech-C: FWHS1-RIPE
Stare: ALOCATE PI
mnt-by: RIPE NCC--HM-PI-MNT
mnt-jos: RIPE NCC--HM-PI-MNT
mnt-by: RECIT-MNT
mnt-rute: RECIT-MNT
mnt-domenii: RECIT-MNT
mnt-by: DAV-MNT
mnt-rute: DAV-MNT
mnt-domenii: DAV-MNT
Sursa: RIPE # Filtered
organizație: ORG-EST1-RIPE
org-nume: INHOSTER
org-tip: NON-registru
Observații: *************************************
Observații: * contacte abuzuri: abuse@inhoster.com *
Observații: *************************************
Adresa: OOO Inhoster
Adresa: Poltavskij Shliax 24, Xarkov,
Adresa: 61000, Ucraina
telefon: +38 066 4633621
e-mail: support@inhoster.com
admin-c: AK4026-RIPE
Tech-C: AK4026-RIPE
mnt-ref: DAV-MNT
mnt-by: DAV-MNT
Sursa: RIPE # Filtered
Persoana: Andrei Kislizin
Adresa: OOO Inhoster,
Adresa: ul.Antonova 5, Kiev,
Adresa: 03186, Ucraina
telefon: +38 044 2404332
NIC-HDL: AK4026-RIPE
Sursa: RIPE # Filtered
Persoana: Fast Web Hosting Suport
Adresa: 01110, Ucraina, Kiev, 20a, str. Solomenskaya. camera 201.
Adresa: UA
telefon: +357 99 117759
e-mail: support@fwebhost.com
NIC-HDL: FWHS1-RIPE
Sursa: RIPE # Filtered
 PRASE , aka "Prase" este un nou instrument web pentru examinarea PageRank atribuit rezultatele de căutare de top de la Google, Yahoo și MSN Search. Termeni de căutare sunt introduse în mod obișnuit, ci o listă combinată a rezultatelor din cele trei motoare de căutare este prezentată în ordine PageRank, de la cel mai mare la cel mai mic, împreună cu motorul de căutare și rangul rezultat.
Am încercat câteva interogări de căutare, cum ar fi "Web 2.0", "Palo Alto", "algoritm de căutare", "Martin Luther King", și a fost surprins să văd cât de repede PageRank 0 paginile începe de cotitură în rezultatele de căutare. Pentru "web 2.0", rezultatul de top de pe Yahoo este intrarea Wikipedia de pe Web 2.0, care pare rezonabil, dar este, de asemenea, o pagină PR0, ceea ce este surprinzător pentru mine. Ca un experiment mai departe, am încercat câteva cuvinte cheie din această listă de top termeni de căutare plătite , cu rezultate în general similare. PageRank este folosit numai de către Google, care nu se mai folosește algoritmul PageRank originală pentru rezultate clasament, dar este încă interesant pentru a vedea rezultatele de căutare de top din cele trei motoare de căutare majore prevăzute cu scoruri de PR pentru a obține un sentiment de legătură paginii. A se vedea, de asemenea: Am împiedicat de o trimitere la un document interesant pe PageRank hacking timp ce se uita la unele zvonuri care nu au legătură la blog-ul lui Ian McAllister lui. Lucrarea nedatat este intitulat " Greșeli de PageRank / ceva este în neregulă cu modelul matematic Google ", de Hillel Tal-Ezer, un profesor de la Colegiul Academic de Tel-Aviv Yaffo. Acesta subliniază o eroare în algoritmul Google PageRank, care cauzează "chiuveta", pagini care nu sunt puternic legate de graficul de web principal de a avea o importanță nerealist. Autorul merge mai departe, explica un algoritm nou cu aceeași complexitate a algoritmului PageRank-ul original care rezolvă această problemă.
După o citire rapidă, prin aceasta, se pare pentru a descrie una dintre tehnicile care au fost populare în rândul unor optimizatori de motoare de căutare o înapoi în timp, în care fermele de link-ar fi construit arătând spre o singură pagină, fără outbound link-uri, într-un efort de a artificial ridica clasament de căutare a paginii țintă. Aceasta tehnica este mai puțin eficientă acum decât în trecut, deoarece Google a continuat să actualizeze indexarea și algoritmi de rang, ca răspuns la succesul de spam link-ul și alte manipulare trafic. Analiza de modele link ( SpamRank , masa link ) și reputația site-ului ( Hilltop ) pot reduce substanțial efectul descris aici. Cu toate acestea, e frumos pentru a vedea o descriere cantitativă a problemei. A se vedea, de asemenea: O lista de lecturi pe PageRank și Algoritmi de căutare Ho John Lee | 11 decembrie 2005 | 1 comentariu prin SEOmoz : Newsweek din această săptămână (12 decembrie, 2005) are un articol despre pălărie vs negru pălărie optimizarea alb motorului de căutare . Printre altele, este interesant faptul că subiectul a făcut-o în mass-media. Un "Black Hat" anecdotă: Folosind un program software ilicit a descărcat de pe net, el a injectat forțat un link către site-ul său de sesizare private de detectivi pe site-ul de Universitatea Stony Brook, Long Island. Majoritatea motoarelor de căutare da o valoare mai mare pentru un link de pe un site de universitate de renume.
Site-ul în cauză pare a fi "www.private-detectives.org", încă în prezent # 1 la MSN și # 4 de la Yahoo pentru căutări pe "detectivi particulari". Se pare că a fost sandboxed pe Google. Un alt mesaj interesant la caracteristici SEOmoz comentarii de la "randfish" și "EarlGrey", cei doi consultanți SEO intervievat de Newsweek pe meritele "White Hat" vs "Black Hat" optimizarea motorului de căutare, și oferă perspective suplimentare cu privire la motivația și perspectivele de cele două abordări. În unele moduri se poate gândi la diferența dintre abordările optimizarea motorului de căutare ca o abordare "de tranzacționare" vs o abordare "clădire" de investiții. Abordarea "Black Hat", articulat în articolul SEOmoz tinde să se concentreze doar pe o tactic prezent reveni bani pentru operator, în timp ce abordarea "White Hat" presupune că operatorul va realiza valoarea viitoare curs de dezvoltare un activ informații utile și de a face o vizibil pentru motoarele de căutare. Acest lucru face o presupunere implicită că site-ul în sine oferă un conținut unic și valoros informații, care nu poate fi, de obicei, în cazul în pe termen lung.
Dintr-un punct de regăsire a informațiilor de vedere, eu sunt în mod evident în tabăra din urmă de gândire care identifica cele mai relevante rezultate pentru utilizator de căutare este un lucru bun. Cu toate acestea, abordarea pălărie neagră are sens dacă îl ia în considerare în ceea ce privește optimizarea randamentului scurt valoarea termen de editor (în numerar și informații), în timp ce, eventual prezentând încă o revenire informație utilizabilă pentru utilizator de căutare. Acest lucru este în special cazul pentru informații produs sau produse, în care informația reală sau produse sunt identice, cum ar fi vânzări afiliat. Sunt un pic curios cu privire la link-ul de la Universitatea Stony Brook. Mi-am luat o privire rapidă, dar nu a fost capabil de a transforma un backlink. Una din problemele cu doar bazându-se pe surse de link-ul de încredere este că acestea pot fi păcălit, corupt, sau tocat. A se vedea, de asemenea: O lista de lecturi pe PageRank și de căutare algoritmi Actualizare 12-12-2005 00:30 PST: O mulțime de comentarii pe postul Matt taiere lui , plus Slashdot Ho John Lee | 01 decembrie 2005 | 7 comentarii Dacă sunteți abonat la feed-ul complet, veți observa am adunat unele lectură de fond pe PageRank, crawlerele de căutare, personalizare de căutare, și de detectare a spam-ului în secțiunea link-uri de zi cu zi ieri . Iată câteva referințe care merită subliniate pentru cei care au un interes în măruntaiele de căutare, în general, și în special Google. - Adanc in interiorul PageRank (PDF) - Internet Matematică Vol.. 1, Nr 3: 335-380 Amy N. Langville și Carl D. Meyer. Detaliate Prezentare 46 de pagini de PageRank și analize căutare. Aceasta este cea mai bună introducere tehnic m-am întâlnit până acum, și are o listă lungă de referințe, care sunt, de asemenea, în valoare de verificat.
- Online Systems Reputație: costul de atac de PageRank (PDF) -
Andrew Clausen. O privire detaliată de la valoarea și costurile de reputație și unele speculații pe cât de mult ar costa să cumpere rang superior prin intermediul spam-ul, link-ul de brokeraj, etc Undeva în această lucrare sau o notă legată de el susține că ridicarea trafic de căutare, teoretic, este prea scump pentru a fie eficiente, care sa dovedit a nu fi cazul, dar ideile de bază din jurul reputație sunt interesante - SpamRank - Detectarea automata Spam Link - Lucrări în curs (format PDF) -
András A. Benczúr, Károly Csalogány, Tamás Sarlós, Máté Uher. Propune o metrică SpamRank pe baza PageRank personalizate și distribuirea PageRank locale de a lega site-uri. - Detectarea duplicat și în apropiere duplicate dosar - William slide-uri de prezentare Pugh pe brevetul SUA 6658423 (atribuit de Google) pentru o abordare cu sindrila (alunecare fragmente de text vitrate) pentru a compara similitudine conținut. Acest lucru a fost realizat în timpul unui stagiu la Google și că nu știe dacă această metodă special este folosit în producție (față de o altă metodă).
Mă uit la o aplicație de căutare destul de îngust în acest moment, dar ideea generală de a folosi reputația subiective pentru a personaliza rezultatele căutării și pentru a filtra conținutul spam pare fundamental sănătoase, mai ales în cazul în care o rețea de încredere (social sau profesional editat) nu e " Nu prea mare. Am pierdut 10 minute obtinerea aceasta să funcționeze corect, așa m-am gândit-l scrie ... Iată ce aveți nevoie pentru a utiliza mod_rewrite pentru a pune în aplicare un permanent 301 Moved răspuns HTTP atunci când vă deplasați un site web de la un subdirector pe un domeniu la un nou domeniu de nivel superior. (Presupunând că sunteți pe un serviciu găzduit, și pot folosi htaccess.):
RewriteEngine pe
RewriteBase /
RewriteRule ^ olddir /? (. *) $ Http://new-domain.com/ un dolar [R = permanent, L]
în cazul în care conținutul de vechi a fost inițial într-un subdirector numit "olddir" și devine mutat la un nou director pe un server diferit. Acest lucru vă permite să mutați conținut pentru un nou domeniu, separat și / sau server fără a rupe legăturile existente. link-ul: mai mult pe htaccess si mod_rewrite în documentația Apache. Yahoo Search Blog anunță Yahoo Site Explorer o alternativă la îndemână pentru a cauta cu "site-ul:" sau "link-ul:" pentru a vedea ce este Noțiuni de bază indexat și legat la Yahoo Search. Este taxat ca o lucrare în curs de desfășurare, în momentul în care se poate: - Arata toate subpagini într-un URL indexate de Yahoo!, care se poate vedea pentru stanford.edu, aici. Puteți vedea, de asemenea, subpagini sub o cale, cum ar fi pentru paginile profesorul Knuth lui.
- Arata inlinks indexate de Yahoo! pentru un URL, cum ar fi pentru paginile profesorul Knuth lui, sau pentru un întreg site ca stanford.edu.
- Trimite URL-uri care lipsesc la Yahoo
Există, de asemenea, un API de servicii web pentru interogări programatice. Discuție la căutare Engine Watch , Lumea Webmaster . Danny Sullivan de la căutare Engine Watch postat un sinopsis de pe forum SEW: Am făcut un rezumat de lucruri aici pe blog, care leagă, de asemenea, la o privire detaliată pentru SEW membri plătite. Aici sunt gândurile mele linie de top: Puteti vedea toate paginile din toate domeniile, de un domeniu, sau un director / secțiune într-un domeniu. Thumbs up! Nu se poate model meciul să se găsească toate URL-urile de la un domeniu. Asta ar fi frumos. Puteti vedea toate link-uri la o anumită pagină sau un domeniu. Thumbs up! Nu se poate exclude link-uri proprii, foarte, din păcate. Două degete în jos! Puteți exporta date, dar numai primele 50 elemente, din păcate. Degetul mare în jos! Mai lista de lucruri: Comenzi de căutare, cum ar fi link-ul: nu sunt acceptate, și sper că s-ar putea veni. Puteți obține un feed de paginile dvs. de top, dar eu vreau un flux de backlink-uri pentru a ma informa de noi care se găsesc. Proprietarii site-ului merită la fel de distractiv de mult ca proprietarii de blog în a ști despre link-uri noi la ei!
Unele dintre alte posturi discuta despre lucruri interesante puteți face cu existente "căutare avansată" opțiuni. Va trebui să încercați unele afară, atât prin Yahoo Site Explorer și folosind unele dintre interogările link propuse, care se pare că nu se poate face încă prin intermediul site-ului Explorer. Sunt aparent un utilizator bine instruit căutare atipice. Utilizatorii studiat într-o utilizatorii de document publicat recent clic pe căutare de sus rezultatul aproape jumatate din timp. Nu este nou, dar în acest studiu au schimbat, de asemenea, pentru a rezulta, pentru anumiți utilizatori, iar oamenii încă cea mai mare parte clic pe rezultatele de căutare de top Am scana de obicei pagina de plin de rezultate de căutare, mai ales atunci când nu sunt sigur unde am de gând să găsească informațiile pe care le caut. Am de multe ori click la întâmplare pe paginile profunde rezultate, precum, mai ales atunci când caută pentru materialul de pe site-uri mai puțin vizibile. Aceasta funcționează și pentru mine pentru că eu sunt capabil să scaneze textul de pe pagina de rapid, iar paginile de căutare suplimentare, de asemenea reveni repede. Acest lucru pare să funcționeze foarte bine pe blog-ul de căutare, în cazul în care multe site-uri sunt în esență unranked pentru relevanță. Această abordare nu funcționează bine, dacă nu ești folosit pentru scanarea pe pagini de text, și, de asemenea, nu funcționează în cazul în care timpul de răspuns pagina de căutare este lent. Pe de altă parte, am luat o încercare rapidă la unele dintre exemple în lucrare de cercetare, și interogări mele (pe Google) au, în general, răspunsul în primele 1-2 rezultatele deja. Din alertbox Jakob Nielsen , Septembrie 2005: Profesorul Thorsten Joachim si colegii sai de la Universitatea Cornell au efectuat un studiu de motoarele de căutare. Printre altele, studiul lor a examinat legăturile utilizatorii au urmat pe SERP (pagina de rezultate motor de căutare). Ei au descoperit ca 42% din utilizatorii de clic lovit de căutare de top, și 8% din utilizatori făcut clic pe cea de a doua. Până în prezent, nici o veste. Multe studii anterioare, inclusiv a mea, au arătat că primele câteva intrările în listele de căutare obține preponderenta de clicuri și că numărul unu hit devine mult mai multe clicuri decât orice altceva. Ceea ce este interesant este al doilea test de cercetatori, care au hranit secret rezultatele de căutare printr-un script înainte de afișarea lor pentru utilizatori. Acest script schimbat ordinea primele două hit-uri de căutare. Cu alte cuvinte, ceea ce a fost inițial numărul doi la intrarea în prioritizarea motorului de căutare a ajuns în partea de sus, iar intrarea de sus a fost retrogradat pe locul al doilea. În această condiție schimbat, utilizatorii încă făcut clic pe intrarea de sus 34% din timp și pe cea de a doua 12% din timp.
Pentru referință, aici sunt întrebările care au fost puse în studiul inițial (182KB, PDF) De navigație - Găsiți pagina de Michael Jordan, statistician.
- Găsi paginile unde sunt afișate pe hartă traseul de autobuze Greyhound.
- Găsi pe pagina web a 1000 Acres Dude Ranch.
- Gasiti pe prima pagina pentru locuințe absolvent de la Universitatea Carnegie Mellon.
- Găsiți pagina de Emeril - bucatar care are un program de gătit de televiziune.
Informațional - În cazul în care este cel mai inalt munte din New York, situat?
- Cu acoperire greu de primare prezidențiale democratice, vă sunt încântați să-și exprime votul pentru un candidat. Când sunt primare prezidențiale democratice din New York?
- Care actorul a jucat în rolul principal, în timp film mașină originală?
- Un prieten ți-a spus că domnul Cornell folosit pentru a trăi aproape de campus - în apropiere de Universitatea și Steward Ave. Are cineva trăiesc în casa lui acum? Dacă da, care?
- Care este numele de cercetator care a descoperit primul antibiotic moderne?
Se pare ca Google Blog Search scos la redirecționări, care au fost de rupere antetele de referință . Acum, cuvintele cheie de căutare sunt din nou vizibile. Iată un jurnal tipic:
xxx.xxx.xxx.xxx - [15/Sep/2005: 15:58:13 -0700] "GET / weblog/archives/2005/09/15/podcasting-and-audio-search-at-sdforum-searchsig-september-2005 / HTTP/1.1 "200 26981" http://blogsearch.google.com/blogsearch?hl=en&q=odeo&btnG=Search+Blogs&scoring=d " "Mozilla/5.0 (Macintosh; U; PPC Mac OS X Mach-O, en-US; rv: 1.7.10) Gecko/20050716 Firefox/1.0.6 "
Blogger Buzz spune redirecționare a fost în loc de timpul de dezvoltare pentru a ajuta la menținerea proiectului în secret. Ho John Lee | 14 septembrie 2005 | 1 comentariu Cerere caracteristică a Google Blog echipă de căutare: vă rugăm să adăugați Caută info interogare la șirul de referrer. O mulțime de acoperire în această dimineață de la persoane care încearcă din Google Blog Search. ( Search Engine Watch , Anil Dash , mult mai multe ) Văd niște trafic de la Google Blog Search peste noapte, dar se pare ca ei nu trimit interogarea de căutare în referrer. Iată o intrare jurnal de eșantioane: xxx.xxx.xxx.xxx - [14/Sep/2005: 00:51:09 -0700] "GET / weblog/archives/2005/09/14/google-blog-search-launches / HTTP/1.1" 200 22964 "Mozilla/5.0 (X11; U; Linux i686, en-US; rv: 1.7.8) Gecko/20050511 Firefox/1.0.4"
Deci, nu există nici o modalitate de a ști interogarea de căutare originală. Am o idee destul de bună cum a traficului peste noapte în căutarea pentru postul Google ajuns aici, dar există, de asemenea, oameni de aterizare pe paginile destul de obscure aici și eu sunt mereu curios cum le-au găsit. Sunt sigur că mulțimea SEO va fi peste tot în scurt timp. Au existat o serie de comentarii care Google Blog Search este un fel de plictisitor, dar eu sunt constatarea că există o bună valoare noutate în care au pagini foarte repede rezultate de căutare. Nu am folosit-o suficient pentru a obține un sentiment de cât de bun de acoperire este, sau cât de repede actualizări, dar va fi o alternativă bun venit la Technorati și altele. Actualizare 09-14-2005 14:01 PDT: Tipii ăștia cred că Google a uitat pentru a elimina unele redirecționa anteturile . Actualizare 09-14-2005 23:25 PDT: Peste la Blogger Buzz , Google spune că au plecat de redirecționare de către accident, va fi luându-le la scurt timp: "După ce faceți clic pe un rezultat de Blog Search, am fi trecut printr-o redirecționare. De ce? " Din păcate, acest lucru nu a fost parte a unui sistem click-recoltare prea inteligent. Am avut redirecționări, în loc de timpul de testare pentru a preveni scurgerea de referrer-și pur și simplu nu le eliminați înainte de lansare. Dar acestea ar trebui să dispară în următoarele 24 de ore ... care va avea avantajul de îmbunătățire a clic-prin timp.
| |