Bookmark cho ngày 17 tháng 1 thông qua ngày 20 tháng 1

Đây là những liên kết của tôi cho ngày 17 tháng 1 đến tháng 20:

  • PG & E hệ thống điện Cúp Bản đồ - bản đồ này cho thấy sự mất hiện tại trong khu vực dịch vụ 70.000 dặm vuông của chúng tôi. Để xem thêm chi tiết về sự gián đoạn, trong đó có nguyên nhân và thời gian dự kiến ​​phục hồi, click vào biểu tượng mã màu kết hợp với cúp đó.
  • Twitter.com vs Twitter hệ sinh thái - Fred Wilson bình luận về một số dữ liệu từ John Borthwick cho thấy Twitter sử dụng hệ sinh thái = 3-5x Twitter.com trực tiếp.

    "Biểu đồ của John ước tính Twitter.com là khoảng 20mm UV một tháng tại Mỹ (thống kê của comScore có nó ở 60mm UV trên toàn thế giới) và các hệ sinh thái Twitter vào khoảng 60mm UV ở Mỹ.

    Mà nói rằng trên tất cả các dịch vụ web, không chỉ AVC, hệ sinh thái Twitter là về 3x Twitter.com. Và trên blog này, mà khán giả chắc chắn là người sử dụng điện, tỷ lệ đó là 5x. "

  • Chris Walshaw :: Nghiên cứu :: Lưu trữ phân vùng - Chào mừng đến với Đại học Greenwich Biểu đồ phân vùng lưu trữ. Các kho lưu trữ bao gồm các phân vùng tốt nhất tìm thấy cho đến nay cho một loạt các biểu đồ và mục đích của nó là cung cấp một chuẩn mực, dựa vào đó các thuật toán phân vùng có thể được kiểm tra, và một nguồn tài nguyên để thử nghiệm.

    Các kho lưu trữ phân vùng đã hoạt động từ năm 2000 và bao gồm kết quả từ hầu hết các gói phần mềm phân vùng đồ thị lớn. Các nhà nghiên cứu phát triển các thuật toán phân vùng thử nghiệm thường xuyên trình phân vùng mới để đưa có thể.

    Hầu hết các đồ thị kiểm tra phát sinh từ các ứng dụng phân vùng điển hình, mặc dù các kho lưu trữ cũng bao gồm kết quả tính toán cho một bộ kiểm tra đồ thị màu [Wal04] chứa trong một phụ lục riêng biệt.

    Các kho lưu trữ ban đầu được thiết lập như là một phần của một dự án nghiên cứu phân vùng chất lượng rất cao và tác giả muốn đề cập đến các kho lưu trữ phân vùng nên trích dẫn bài báo [SWC04].

  • Thu thập thông tin «The Guy của Twitter sản phẩm - "Danh sách các sự cố ảnh hưởng đến thời gian tải trang của sản phẩm Twitter, phân biệt giữa tổng số thời gian chết, và một phần thời gian chết và thông tin bất khả tiếp cận, dựa trên các bài đăng công khai trên blog Twitter.

    http://status.twitter.com/archive

    Tôi đã làm hết sức mình để không tăng gấp đôi tính bất kỳ vấn đề, nhưng rất khó vì nhiều vấn đề xảy ra rất thường xuyên, và nó thường rất khó để phân biệt, từ các bài đăng trên blog tình trạng một mình, giữa một vấn đề kiên trì được kinh nghiệm hoặc cố định, từ đó của một sự xuất hiện mới của một vấn đề tương tự hoặc giống nhau. Hơn nữa, tôi cũng loại trừ tác động trên Thời gian tải trang xuất phát từ kế hoạch bảo trì / thời gian chết - khoảng thời gian mà qua đó kỳ vọng người sử dụng sẽ được liên kết với hầu hết các lời hứa của sản phẩm của Thời gian tải trang. "

  • Soundboard.com - Soundboard.com là Danh mục của web lớn nhất của âm thanh miễn phí và soundboards - trong hơn 20 loại, cho điện thoại di động hoặc máy tính. 252.858 âm thanh miễn phí trên 17,171 soundboards từ phim đến thể thao, hiệu ứng âm thanh, truyền hình, người nổi tiếng, lịch sử và du lịch. Hoặc xây dựng, tùy chỉnh, địa chỉ mạng và quản lý của riêng bạn

Bookmark cho 28 tháng tư 5:35-14:24

Đây là những liên kết của tôi cho ngày 28 tháng tư 5:35-14:24:

  • Chính thức của Google Blog: Thêm sức mạnh tìm kiếm để dữ liệu công cộng - Thú vị. Tự hỏi, nếu tập hợp dữ liệu xã hội cơ bản cuối cùng sẽ trở nên có sẵn trên Google App Engine là tốt, loại giống như các bộ dữ liệu công cộng có sẵn để sử dụng với các ứng dụng Amazon EC2.
  • MySQL và Tìm kiếm Tại Craigslist - slide Jeremy Zawodny về MySQL, Sphinx, và miễn phí thực hiện tìm kiếm văn bản ở Craigslist, từ hội nghị MySQL tuần trước.
  • Nghiêng, Kỹ sư Frontend của Misery @ không hợp lý Exuberance - Đối với mashup và như thế, sự khác biệt giữa một kỹ sư FE và web dev là khá nhỏ về kỹ năng kỹ thuật, họ đều sử dụng các skill đó, họ đều tương tác với API, và vv. Tuy nhiên, có những khác biệt quan trọng giữa hai: 1. các nhà phát triển web có xu hướng di chuyển trong các nhóm nhỏ hay cá nhân, trong khi các kỹ sư fe làm việc theo nhóm lớn hơn, 2. các nhà phát triển web có xu hướng để thiết kế một sản phẩm trên một dịch vụ phụ trợ hiện có (api, vv), trong khi các kỹ sư fe thường làm việc song song với các phụ trợ được phát triển.
  • Nghiên cứu: Twitter khán giả của Không có một chính sách trở lại - Hơn 60 phần trăm số người đăng ký sử dụng phổ biến (và rất nhiều thảo luận) nền tảng tiểu blog không quay trở lại sử dụng nó vào tháng sau, theo số liệu mới công bố của Nielsen Online . Nói cách khác, Twitter hiện đang có chỉ là một tỷ lệ duy trì 40 phần trăm, so với 30 phần trăm trong tháng trước đó-cho thấy một "Tôi không hiểu yếu tố" trong những người dùng mới đó là gợi nhớ của tương tự như giao thổi phồng Second Life từ một vài năm trước đây.
  • Hey Mỹ, đánh giá cao tự do của bạn Of Speech: NPR - Firoozeh Dumas trên các quyền tự do bị đánh giá thấp ngôn luận chúng tôi có ở Mỹ vs nhà báo và blogger ở Iran.

Bookmark cho 21 tháng 2 13:59-21:55

Đây là những liên kết của tôi cho 21 tháng 2 13:59-21:55:

  • Không Sequitur - Gocomics.com - "Xin chào Tên tôi là Bob, và tôi là một người nghiện Twitter ...".
  • A Hướng dẫn về Support Vector Máy Pattern Recognition - Christopher JC Burges (PDF) - Xuất hiện trong: Khai thác dữ liệu và kiến thức Discovery 2, 121-167, 1998. Hướng dẫn bắt đầu với một tổng quan về các khái niệm của VC kích thước và cấu trúc rủi ro
    giảm thiểu. Sau đó chúng tôi mô tả tuyến tính Support Vector Machines (SVM) cho tách và không thể tách rời
    dữ liệu, làm việc thông qua một ví dụ không tầm thường một cách chi tiết. Chúng tôi mô tả một tương tự cơ khí, và thảo luận
    khi các giải pháp SVM là duy nhất và khi họ đang toàn cầu. Chúng tôi mô tả cách hỗ trợ đào tạo vector có thể
    được thực hiện trên thực tế, và thảo luận chi tiết các bản đồ kỹ thuật hạt nhân được sử dụng để xây dựng
    Các giải pháp SVM là phi tuyến trong các dữ liệu. Chúng ta thấy làm thế nào máy Support Vector có thể có rất lớn
    (Thậm chí vô hạn) VC kích thước bằng cách tính toán kích thước VC cho đa thức thuần nhất và Gaussian
    xuyên tâm cơ sở chức năng hạt nhân. Trong khi kích thước VC rất cao thường là điềm xấu cho tổng quát
    hiệu suất, có một số đối số có hỗ trợ độ chính xác cao quan sát của SVM,
    mà chúng tôi xem xét.
  • Nghiên cứu khai thác dữ liệu - dataminingblog.com: thợ mỏ dữ liệu trên Twitter - Một danh sách những người khai thác dữ liệu trên twitter.
  • YouTube - Khủng hoảng tín dụng bằng hình - Phần 1 - Nice hoạt hình phim cố gắng để trình bày một lời giải thích đơn giản của cuộc khủng hoảng tín dụng và mối quan hệ giữa cho vay thế chấp nhà, đòn bẩy ngân hàng và rủi ro.
  • "10 trở ngại đối với điện toán đám mây" của UC Berkeley & Làm thế nào GoGrid vượt rào Them | GoGrid Blog - Một bài bình luận trên UCB điện toán đám mây giấy tổng quan gần đây

Mới và cải tiến

Tối nay tôi tung ra một bản cập nhật dài quá hạn cho nền tảng blog. Đó là một chút phức tạp, bởi vì tôi đã được chạy một WordPress rất nhiều tùy chỉnh 1.5.2 trong một thời gian dài, và đã có rất nhiều thay đổi kể từ đó đến với WordPress, bổ sung khác nhau, và cơ sở dữ liệu cơ bản (phiên bản hiện tại là 2.7 0,1).

hjl-weblog-feb09-beforehjl-weblog-feb09-after

Các phiên bản mới dựa trên Atahualpa , trong đó có nhiều lựa chọn tùy biến. Các bài viết gần đây, Tag Cloud, kết gần đây, tình trạng Twitter, và permalinks được tất cả làm việc như trước đây. Các mẫu mới không có chỗ cho những hình ảnh biểu ngữ trước lựa chọn ngẫu nhiên từ tài khoản Flickr của tôi, nhưng không kết hợp một hình ảnh ngẫu nhiên lớn hơn ở đầu, hiện lựa chọn từ một vài hình ảnh tôi đã chọn ra các bộ sưu tập ảnh chụp của tôi. Tôi có thể tìm ra một số cách khác chia sẻ một số hình ảnh ở đây. Tôi cũng đã thêm một widget trích dẫn ngẫu nhiên. Bạn phải cung cấp bộ sưu tập của riêng bạn của dấu ngoặc kép, vì vậy không có nhiều trong đó được nêu ra.

Nó có thể là một chút chậm hơn so với các nền tảng cũ trong một thời gian cho đến khi tôi nhận được bộ nhớ đệm được thiết lập, tất cả các lựa chọn tùy biến sử dụng rất nhiều các truy vấn cơ sở dữ liệu.

Hãy cho tôi biết những gì bạn nghĩ, và nếu bạn có bất cứ đề nghị hoặc không xem được mọi thứ. Tôi đã chủ yếu được nhìn vào điều này với Firefox 3, vì vậy những người có trình duyệt khác có thể có một kinh nghiệm khác nhau.

140 ký tự là tốt đẹp, nhưng không phải luôn luôn làm việc

Tôi đã không được đăng ở đây trong một thời gian, nhưng nghĩ rằng tôi sẽ cố gắng chọn lên các bàn phím ở đây thường xuyên hơn một chút. Tôi đã thêm một hộp twitter trên thanh bên một khi trở lại, như tôi đã được thử nghiệm với điều đó nhiều hơn, cùng với friendfeed, facebook, vv Tôi thích ngắn gọn và nhanh chóng của twitter, nhưng không phải tất cả mọi thứ phù hợp trong 140 ký tự. Bạn có thể tìm thấy tôi trên twitterfriendfeed như "hjl", cũng trên Facebook.

Xin chào độc giả tàng hình

Xin chào, độc giả thân yêu. Tôi đã ăn trưa với một số người bạn khác trong ngày và họ nói rằng tôi đã không được đăng trong một thời gian. Xin lỗi tôi đã không được chú ý nhiều đến trang web này thời gian gần đây, trừ gõ lại nhận xét và liên kết thư rác. Gần đây tôi thấy rằng Google Reader đang bắt đầu báo cáo thống kê đăng ký , trong đó nhắc nhở tôi phải có một cái nhìn. Nó được một lúc kể từ khi tôi nhìn qua các bản ghi máy chủ, và tôi đã rất ngạc nhiên khi thấy số lượng đăng ký RSS đã tích lũy (tức là nó nhiều hơn tôi có thể giải thích cho bạn bè, gia đình và những người quen biết ngẫu nhiên). Tôi không biết bạn đã ra khỏi đó, nhưng bây giờ mà bạn đang decloaked và tôi có thể nhìn thấy bạn, tôi muốn nói xin chào.

Tôi đã kết thúc, nghỉ ngơi sau gửi bài cho một vài tuần (kể từ đầu năm). Không phải do trùng hợp ngẫu nhiên, tôi cũng đẩy mạnh hoạt động của tôi kể từ đầu năm, chuẩn bị cho Big Sur Marathon năm nay , trong khi giữ các nghĩa vụ khác khoảng không đổi.

Dù sao, tôi nghĩ rằng tôi sẽ thử một số phương pháp tiếp cận khác nhau để gửi bài ở đây và xem nó hoạt động ra ngoài.

Làm thế nào để tìm ra những người đồng hồ Rocketboom


Tôi ngạc nhiên bởi khối lượng của cuộc thảo luận về Amanda Congdon , Andrew Baron , và lịch sử và tương lai (hay không) của Rocketboom . Tôi mong muốn được nhìn thấy những gì một hoặc cả hai trong số họ đi về phía trước, như mọi người khác, nhưng không có gì để thêm vào các cuộc thảo luận khác hơn lời chúc tốt nhất.

Tuy nhiên ... vạt cũng có tác dụng phụ hiển thị mà chỉ là về tất cả mọi người tôi "biết" trực tuyến đã được xem Rocketboom. Kiểm tra tìm kiếm Công cho con trỏ để khởi hành bài của Amanda và xem có bao nhiêu tên bạn nhận ra. Ai biết?

Cập nhật 07-06-2006 16:20 PDT: Rocketboom truyện tranh
Cập nhật 07-12-2006 21:42 PDT: Rocketboom là trở lại không khí với máy chủ mới Joanne Colan, đây là đầu tay của cô .

Đưa nhanh chóng trên Google Reader

Ghi chú nhanh chóng của tôi cố gắng ra Google Reader :

Tóm tắt:

  • Giao diện người dùng AJAX là whizzy và vui vẻ, và cũng tương tự như một trình đọc e-mail.
  • Nhập khẩu thức ăn là rất chậm.
  • Các phím tắt bàn phím điều hướng là rất lớn.
  • Tìm kiếm thông qua nguồn cấp dữ liệu của riêng bạn hoặc cho thức ăn mới thuận tiện sử dụng Google
  • Tôi ghét có một mục duy nhất hiển thị tại một thời điểm.
  • "Blog này" hành động là tiện dụng, nếu bạn sử dụng Blogger. Họ có thể dễ dàng thực hiện điều này đi đến các dịch vụ blog khác sau đó.
  • Điều này có thể là một "khởi động" dịch vụ giới thiệu một người nào đó để nuôi độc giả tốt, nhưng
  • Không có cơ chế xuất khẩu đăng ký rõ ràng
  • Không đối phó tốt với tổ chức một số lượng lớn thức ăn.

Lưu ý khác:
Tôi bắt đầu nhập khẩu các tập tin đăng ký OPML từ Bloglines vào Google Reader vào tối thứ sáu . Tôi có khoảng 500 thuê bao trong danh sách đó, và tôi không chắc chắn nó đã kết thúc bao lâu lên tham gia nhập khẩu. Đó là hơn 15 phút, đó là khi tôi bắt đầu đi ngủ, và đôi khi trước khi hoàn thành chiều nay.

Tôi thích có các phím tắt bàn phím điều hướng. Giao diện người dùng dựa trên AJAX là khỏe và "vui vẻ". Thật không may, Google Reader hiển thị các bài viết cùng một lúc, một chút giống như đọc e-mail. Tôi có thói quen quét các phần của danh sách đăng ký để nhìn thấy phần tôi muốn xem xét, sau đó quét và di chuyển qua danh sách các bài viết trong Bloglines. Mặc dù điều này đòi hỏi bạn dùng chuột và nhấp vào, nó nhanh hơn rất nhiều so với nhấp nháy một bài viết tại một thời điểm trong Google Reader.

Tôi không nghĩ rằng hệ thống tổ chức thức ăn hiện nay hoạt động trên Google Reader, ít nhất là cho tôi. Hiện tại (xấu) nhóm thức ăn từ Bloglines của tôi hiển thị trên Google Reader như là "Labels" cho các nhóm thức ăn, đó là tốt đẹp. Thật khó để chỉ cần đọc một tập hợp các nguồn cấp dữ liệu, mặc dù. Đăng hiển thị trong thứ tự thời gian, hoặc sự liên quan. Điều này là hoàn toàn không sử dụng được cho một số lượng lớn thức ăn, đặc biệt là khi một số trong số đó là lưu lượng truy cập cao, ưu tiên thấp (ví dụ như Metafilter, del.icio.us, động đất USGS). Nếu tôi có thể nhận được sự "liên quan" điều chỉnh bởi bối cảnh (dựa trên nhãn hoặc thẻ) nó có thể có ích.

Khi bạn thêm một thức ăn mới, nó bắt đầu ra sản phẩm nào, và xuất hiện thêm bài viết chỉ khi chúng được đăng. Nó sẽ được tốt đẹp để họ bắt đầu với bất cứ điều gì Google đã lưu trữ rồi. Tôi chắc rằng tôi không phải là thuê bao đầu tiên của hầu hết các nguồn cấp dữ liệu trong danh sách của tôi.

Về mặt tích cực, điều này có vẻ như một điểm khởi đầu tốt cho một người mới để nuôi độc giả và mong muốn một giải pháp dựa trên web. Có vẻ tốt đẹp, mọi người đã nghe nói về Google, và các hành vi mặc định có thể chơi tốt hơn với một số lượng khiêm tốn thức ăn. Tính đến thời điểm này, tôi đã chỉ đạo người dân tại Bloglines trong quá khứ, và gần đây chỉ cho họ ở Rojo.

Tôi muốn các giao diện người dùng Bloglines có thể được sửa đổi để làm cho nó nhanh hơn để có được xung quanh. Tôi thực sự thích bàn phím điều hướng. Tôi cũng có thể thấy một số tiềm năng trong danh sách các Google Reader bằng cách "liên quan" chứ không phải là danh sách ngày, và cải thiện tìm kiếm và tích hợp blog. Tôi thường xuyên xuất hiện một cửa sổ để chạy tìm kiếm trong khi đọc trong Bloglines.

Google Reader không có vẻ như nó khá những gì tôi đang tìm kiếm ngay bây giờ, nhưng tôi sẽ giữ một mắt trên đó.

Mơ tưởng:
Tôi nghĩ rằng tôi muốn một cái gì đó để quản lý nhiều hơn thức ăn hơn tôi có bây giờ, nhưng mà tôi đang đọc một vài thường xuyên, một vài bài viết từ một hồ bơi của nguồn cấp dữ liệu dựa trên "liên quan", và các sản phẩm từ các khu phố "" thức ăn của tôi khi họ nhấn một số tiêu chí "liên quan". Tôi cũng muốn tìm kiếm hồ bơi của tôi xác định / gắn thẻ thức ăn, cùng với một số "khu phố" thức ăn và các liên kết khác. Tôi nghĩ rằng rất nhiều trong số này là về việc thiết lập bối cảnh, mục đích, và một số loại "cửa quyền", để tăng cường cho phù hợp với từ khóa tìm kiếm thông thường.

Google Blog Search - Referrers làm việc Bây giờ

Có vẻ như Google Blog Search đã diễn ra các trang đổi hướng đã vi phạm các tiêu đề giới thiệu .

Bây giờ các từ khóa tìm kiếm có thể nhìn thấy một lần nữa. Dưới đây là một mục nhật ký điển hình:

xxx.xxx.xxx.xxx - [15/Sep/2005: 15:58:13 -0700]
"GET / weblog/archives/2005/09/15/podcasting-and-audio-search-at-sdforum-searchsig-september-2005 /
HTTP/1.1 "200 26981" http://blogsearch.google.com/blogsearch?hl=en&q=odeo&btnG=Search+Blogs&scoring=d "
"Mozilla/5.0 (Macintosh; U; UBND tỉnh Mac OS X Mach-O; en-US; rv: 1.7.10) Gecko/20050716
Firefox/1.0.6 "

Blogger Buzz nói chuyển hướng đứng ở vị trí trong thời gian phát triển để giúp giữ cho dự án bí mật.

Google Blog Search - Không có người giới thiệu Từ khoá?

Yêu cầu tính năng cho đội ngũ Tìm kiếm Blog của Google: tìm kiếm thông tin xin vui lòng thêm truy vấn vào chuỗi giới thiệu.

Rất nhiều bảo hiểm sáng nay từ những người cố gắng ra Google Blog Search. ( Search Engine Watch , Anil Dash , nhiều hơn nữa )

Tôi thấy một số lưu lượng truy cập từ Google Blog Search qua đêm, nhưng có vẻ như họ không gửi truy vấn tìm kiếm trong giới thiệu. Dưới đây là một bản ghi mẫu:

xxx.xxx.xxx.xxx - [14/Sep/2005: 00:51:09 -0700] "GET / weblog/archives/2005/09/14/google-blog-search-launches / HTTP/1.1" 200 22.964 “http://www.google.com/url?sa=D&q=http://www.hojohnlee.com/weblog/archives/2005/09/14/google-blog-search-launches/” "Mozilla/5.0 (X11; U; Linux i686; en-US; rv: 1.7.8) Gecko/20050511 Firefox/1.0.4"

Vì vậy, không có cách nào để biết các truy vấn tìm kiếm ban đầu. Tôi có một ý tưởng khá tốt như thế nào lưu lượng truy cập qua đêm tìm kiếm các bài viết của Google có ở đây, nhưng cũng có người hạ cánh trên trang khá tối tăm ở đây và tôi luôn tò mò làm thế nào họ tìm thấy chúng. Tôi chắc rằng đám đông SEO sẽ kết thúc tất cả điều này trong thời gian ngắn.

Đã có một số ý kiến ​​cho rằng Google Blog Search là loại nhàm chán, nhưng tôi thấy rằng có giá trị mới lạ tốt trong có các trang kết quả tìm kiếm thực sự nhanh chóng. Đã không sử dụng nó đủ để có được một cảm giác như thế nào tốt là bảo hiểm, hoặc làm thế nào nhanh chóng cập nhật nó, nhưng nó sẽ là một thay thế tốt cho Công và những người khác.

Cập nhật 2005/09/14 14:01 PDT: Những anh chàng này nghĩ rằng Google đã quên để loại bỏ một số chuyển hướng tiêu đề .

Cập nhật 2005/09/14 23:25 PDT: Trong lúc Blogger Buzz , Google cho biết họ rời chuyển hướng trong cách tình cờ, sẽ đưa họ ra ngay:

"Sau khi nhấp vào một kết quả trong Blog Search, tôi được thông qua thông qua một chuyển hướng. Tại sao? "
Đáng buồn thay, đây không phải là một phần của một chương trình nhấp thu hoạch quá thông minh. Chúng tôi đã có các chuyển hướng trong ra trong thử nghiệm để ngăn chặn rò rỉ và giới thiệu-chỉ đơn giản là không loại bỏ chúng trước khi khởi động. Nhưng họ cần phải được đi trong 24 giờ tiếp theo ... sẽ có lợi thế của việc cải thiện thời gian nhấp chuột qua.

Google Blog Search ra mắt

Google nhập vào blog tìm kiếm đưa ra tối nay, hãy thử nó ra hoặc đọc trang trợ giúp của họ .

This will be interesting competition for the existing blog search companies. It definitely responds fast at the moment, let's see how it holds up when the next flash news crowd turns up…

via Niall Kennedy and Kevin Burton

WordPress Contact Form 1.3 Update

We're using the WordPress WP-ContactForm plugin by Ryan Duff and Firas Durri on some of our sites. During the past few weeks, there has been an increasing volume of attempted spam e-mail through the contact form. The latest update (1.3) has additional validation on the form input to prevent the injection of MIME enclosures, additional mail header fields, etc.

Here's a recent discussion thread on the WordPress support forum. Firas says:

For those curious, the spamming/attaching is done via injecting extra headers alongwith the 'From' field. It's not done using the actual html interface, but via other agents posting to the script.

The update announcement is here ; the latest version is available on the plugin project page .

If you're running an earlier version of the WordPress Contact Form plugin, this update should block the latest round of spam agents attempting to abuse the older version.

Cleaning up comment spam

The past couple of days I've received a few hundred comment spams from “Kelly Ronald”, “John Reed”, “Nicholas Truman”, “Peter Back”, and “Alexander Kolt”, from IP addresses in Mexico, Taiwan, France, Australia, and California, among others. Most of them are tagged by the stopword list, but it's a reminder that I should revisit the antispam implementation while I'm reworking the site. For now, I'm making good use of the bulk comment edit feature in WordPress.

Jeff Clavier appears to have gotten the same treatment :

Nếu bạn đang như tôi, bạn đã nổ tung bởi ý kiến ​​"thân thiện" từ Alexander Kolt, Nicolas Trumen, John Reed, Peter Back, và Kelly Ronald - tất cả các ca ngợi blog của bạn, bài viết của mình và chính mình.
Này thế hệ mới của thư rác nhận xét là nhiều hơn thông minh hơn trước nhưng đối với một điều - thực tế là gửi thư rác đang chọn bài cũ mà không có ghi chú trên nữa. Nếu không họ sử dụng bài viết blog VN / blog và trong một vài trường hợp, nó không phải là thậm chí rõ ràng mà trang web họ đang "mối lái"

Jeff cũng bật lên một diễn đàn an ninh với thông tin bổ sung :

Chúng tôi đã trải qua một "cuộc tấn công lớn" của Spam trên hệ thống blog của chúng tôi từ máy chủ khác nhau tất cả chỉ vào hai trang web:
http://www.cosmicbuddha.com/blog/archives/ 001169.html (Tôi đã phá vỡ URL cố ý)

http://anthony.ianniciello.net/blog/archives/ 000079.html (tôi đã một lần nữa phá vỡ URL cố ý)
Các ý kiến ​​có câu rất ngắn gọn và liên kết đến các trang web trên.
Từ những gì có vẻ như nó là một hành động một cuộc tấn công chống lại danh sách đen tự động và nhận xét chưa kiểm duyệt, có thể không được thực hiện bởi tác giả của các blog trên.

Tác giả của ít nhất một trong các trang web liên kết đến trong này chạy thư rác dường như không chịu trách nhiệm, anh ta có một bình luận trên bài viết liên kết trên, và một trong những bài viết của mình có hiệu quả được thực hiện trên của các cuộc thảo luận về việc anh đã kết thúc lên như một trong hai liên kết mục tiêu trong các ý kiến ​​thư rác được đăng.

Hàng loạt thư rác này có vẻ như một chút ngẫu nhiên. Các thông tin đăng thư rác điển hình tôi thấy ở đây cố gắng để liên kết đến các trang web thương mại và spamblogs. Không ai trong số các trang web được liên kết trong tập này xuất hiện để được hưởng lợi từ các thư rác. Vì vậy, có lẽ đây là một thử nghiệm chạy cho một cái gì đó trong sự phát triển. Suy nghĩ tuyệt vời.

Riêng, tôi cũng đã nhìn thấy một số nỗ lực để gửi thư rác e-mail thông qua một hình thức PHP mail cứng mã hoá. Bill Lazar đề cập đến nhìn thấy một số lưu lượng truy cập tương tự trên trang web của mình:

Trong vài ngày qua, tuy nhiên, ai đó hoặc kịch bản của ai đó đã tìm thấy hình thức và được làm đầy nó ra nhiều lần. Tôi đoán ý tưởng là một tỷ lệ phần trăm hữu ích của các hình thức web sẽ kích hoạt một phản ứng tự động đó là mối quan tâm của các lập trình viên mặc dù chỉ là những gì không phải là rõ ràng với tôi. Kịch bản điền vào các trường mẫu với cùng một dữ liệu, địa chỉ email của một nhân vật bốn hoặc năm nhóm ngẫu nhiên các chữ cái (như xtpku) ở lĩnh vực này.

Các bài formmail xấu bắt nguồn từ những 213.114.195.37 và 66.166.127.226, trong số những người khác. Tôi không nghĩ rằng nó thực sự thành công trong việc gửi mail bất cứ nơi nào, nhưng nó làm tắc nghẽn hộp thư hành chính với những thông điệp thất bại.

Cập nhật 2005/09/14 16:20 PDT: Đang cập nhật để WP-Contact Form 1.3 dường như giúp . Vẫn thấy thư rác đã cố gắng từ các địa chỉ IP mới, bao gồm 62.93.34.155, 67.169.28.125, 146.83.216.207, 206.206.126.44, và 210.0.200.2. Hy vọng rằng họ sẽ tìm ra rằng nó không làm việc và di chuyển trên.

BBS05 - San Francisco

BBS05 San Francisco
IMG_3897

Các phiên họp chính vào thứ năm và thứ sáu là trong hội trường lớn ở tầng dưới tại khách sạn Palace. Sự kiện này được dốc như một "kinh doanh" viết blog sự kiện, và khán giả dường như chủ yếu là PR, tiếp thị, và những người quảng cáo. Bộ nhớ chung là một cái gì đó giống như "những gì chính xác là công cụ blog này và những gì tôi cần phải làm gì về nó?" Trong một chương trình của bàn tay, một phần đáng kể (hơn một nửa?) Của những người tham dự đã không viết blog, hoặc để kinh doanh hoặc cá nhân, nhưng hơn một nửa đã được thỉnh thoảng đọc blog.

Rất nhiều doanh nghiệp (và con người) hành vi có thể được quy cho một sự kết hợp của sự sợ hãi và tham lam. Trong trường hợp này, một số các "sợ" sẽ là:

  • Mất kiểm soát hoặc không đoán được bởi PR tiêu cực. Các Kryptonite xe đạp khóa xe cho thuê đã được thường xuyên được trích dẫn trong các cuộc thảo luận.
  • Tiếp xúc với pháp lý nếu nhân viên của tôi đang viết blog, hoặc tiếp xúc với PR nếu ý kiến ​​tiêu cực hoặc nói ghét bỏ bởi ý kiến.

Vào "tham lam" phía trước:

  • Viết blog là mới, và có thể trở thành một lợi thế cạnh tranh (hay bất lợi, nếu đối thủ cạnh tranh đang làm việc đó) cho các sản phẩm và dịch vụ hiện có. Ford vs GM đã được trích dẫn nhiều lần, cũng Clip và Seal.
  • Cơ hội để tuyển dụng khách hàng mới, ảnh hưởng đến người tiêu dùng thông qua truyền-miệng xác thực hơn so với quảng cáo đại chúng.

Giả định rằng đám đông này là đại diện của sự quan tâm và nhận thức của các doanh nghiệp, có một chặng đường dài để đi trong các công ty về các cơ hội thay đổi, rủi ro, và đặc điểm của các blog và đưa lên trang web cung cấp thông tin giáo dục. Ngoài ra còn có một vấn đề khả năng sử dụng / explainability cho phần mềm và dịch vụ nhà cung cấp. Tôi không thích của Microsoft "web Thức ăn" đẩy, nhưng nó đại diện của các loại thay đổi đó sẽ là cần thiết để có được ra khỏi các cuộc thảo luận công nghệ tập trung và vào cuộc trò chuyện về giá trị kinh doanh tiềm năng giữa các dòng chính, vs thị trường sớm nhận con nuôi.

Công cụ khác:
Giới thiệu wordpress và thông báo của wordpress.com (lưu trữ WordPress, TypePad như)
Movable Type 3.2 giới thiệu và phát hành

Các dịch vụ không dây vào thứ năm là rất không ổn định, có thể là do số lượng lớn người sử dụng. Thứ sáu, đội AnchorFree tắt xác thực RADIUS mà dường như để cải thiện sự sẵn có của kết nối.

Cuối cùng, Microsoft đã đưa ra một số túi messenger Ogio tốt đẹp. Một trong những túi cũ của tôi chỉ cắn bụi một vài tuần trước đây, và tôi chỉ mới bắt đầu tìm kiếm một, vì vậy tôi nghĩ rằng tôi sẽ cung cấp cho một một thử này trong một thời gian.

Xem thêm: BBS05 - Thứ tư

Sự tất yếu của Blog Gia công phần mềm

Các blog của gia công phần mềm chủ đề đã tung cùng trong khi tôi đã được chi tiêu trong ngày tại Hội nghị Thượng đỉnh Kinh doanh Blog , nghe thảo luận về thương mại hóa blog. Bây giờ có một bài về nó (Gia công phần mềm blogger tại Trung Quốc) tại CNET, mà bật lên một vài khác hoài nghi, và nó trông như những kẻ Blogoriented có thể là một trò lừa bịp.

Mặc dù vậy, tôi cũng nghĩ rằng đó là không thể tránh khỏi rằng chúng ta sẽ thấy ít nhất một vài dự án thực cùng những dòng này trong vòng một năm, không nhằm mục đích mô phỏng thiếu nữ, mà là ở xây dựng mạng lưới blog, điền và buzzed bằng cách tạo ra nội dung ban đầu tốn kém và tìm kiếm chỉnh sửa nguồn cấp dữ liệu mà hốc mục tiêu cụ thể.

David Sifry tại Công có một bản tóm tắt tốt về phát triển các vấn đề của blog thư rác và blog giả , và tất cả các công cụ tìm kiếm có khả năng thực hiện tiến bộ chống lại những gì cơ bản là thế hệ tiếp theo của trang trại liên kết . Thật không may, như được thảo luận trong này của buổi chiều buổi quảng cáo web và các mô hình liên kết, nếu bạn có thể nhận được lưu lượng truy cập, có tiềm năng cho rất nhiều tiền để được thực hiện bằng các thao tác đơn giản của hệ thống, ít nhất cho đến khi công cụ tìm kiếm nâng cao. Nội dung chọn của các công cụ tìm kiếm blog được lập chỉ mục ngay lập tức, để lại một con đường xung quanh một số các sandboxing và các cơ chế khác được sử dụng bởi Google và những người khác, và làm cho các liên kết có lợi nhuận có thể nhìn thấy ngay lập tức.

Đó là giá rẻ và dường như có hiệu quả để thực hiện thư rác và blog giả mạo. Tôi đã nhận thấy khối lượng e-mail rác đang giảm dần, trong khi số lượng các blog spam trong kết quả tìm kiếm dường như ngày càng tăng. Nó sẽ mất hợp tác giữa nhiều bên để sửa lỗi này, nhưng tất cả mọi người công nhận điều này là một vấn đề, do đó, nó sẽ tốt hơn. (Đây là mất của Mark Cuban .)

Tôi nghĩ rằng một tiếp theo về vấn đề là thực sự "bản gốc" nội dung, trong "đầu tiên tác giả" có ý nghĩa, chứ không phải trong "ý tưởng mới" cảm giác, có thể có thể được làm quay đáng tin cậy thông qua một quá trình được xác định rõ. Hãy suy nghĩ về một cái gì đó giống như một trung tâm cuộc gọi Ấn Độ hoặc mã hóa cửa hàng lai với một văn phòng tin tức hàng ngày, được giám sát bởi một biên tập viên người chọn chủ đề với một số hướng dẫn từ Wordtracker, Google và những người khác. Bạn sẽ nhận được chi phí thấp, văn bản ban đầu, xung quanh một editorially phù hợp, thiết lập tại chỗ có liên quan của chủ đề, và có lẽ ngay cả với một số chuyên gia miền thú vị, tất cả các điều chỉnh để được thông tin và keyworded được công cụ tìm kiếm thân thiện.

Nhiều quá trình tương tự được sử dụng tại Wipro, Infosys, và phần mềm khác và BPO gia công có thể được điều chỉnh để ứng dụng này. Tại sao lừa các bảng xếp hạng công cụ tìm kiếm khi bạn chỉ có thể làm giảm chi phí sản xuất và thực sự nhận được lợi ích khi xếp hạng công cụ tìm kiếm được tốt hơn lọc cho kết quả tốt hơn và theo ngữ cảnh để loại bỏ các blog "thực sự giả"? Mô hình mạng lưới blog weblog Inc vẻ là làm việc cho đến nay - Jason Calcanis nói rằng họ đã chỉ cần nhấn một tỷ lệ doanh thu quảng cáo hàng năm $ 1M . Giảm chi phí sản xuất nội dung không thể làm tổn thương. Tôi chắc rằng họ có thể áp dụng một số trong những ý tưởng, nếu họ chưa có, và nếu họ làm không, một số mạng blog mới khác chắc chắn sẽ cố gắng.

Phương pháp này để canh tác hiện các nhiệm vụ định hướng quá trình viết nên áp dụng chung cho một số tạp chí, như báo và tạp chí. Sự khác biệt giữa nội dung tin tức trên nhiều tờ báo đã được thường chỉ thích các biên tập viên địa phương trên AP hoặc newsfeeds Reuters và những gì phù hợp giữa inch quảng cáo cam kết.

Tôi không nghĩ rằng điều này sắp xếp của blog hoặc gia công phần mềm nội dung sẽ là "xấu" hay "ác" trong ý nghĩa của việc tạo ra nội dung chất lượng thấp hơn, ít nhất là trong một số lĩnh vực chủ đề, từ một hồ bơi của các chuyên gia có tay nghề cao đã tồn tại ngoài khơi, và đang phát triển nhanh chóng. Nếu bạn có một trình soạn thảo tốt tại chỗ, thậm chí nó có thể cải thiện chất lượng tổng thể của nội dung trực tuyến. Nó không phải là trình bày sai, trừ khi bạn đã cố gắng để vượt qua khỏi các tác giả của bạn như là một cái gì đó họ không. Nhưng tôi sẽ không bận tâm với cố các sắc thái của văn hóa địa phương của Hoa Kỳ với một nhân viên của các blogger nước ngoài, mặc dù đã có các chương trình truyền bá văn hóa họ chạy các học viên trung tâm cuộc gọi thông qua. Điều đó sẽ làm việc về cũng như có các blogger Mỹ bao gồm dế hoặc Bollywood tin đồn hay ca sĩ K-pop Hàn Quốc cho khán giả địa phương của mình.

Điều này dường như lại văn hóa nhạc pop Mỹ như một thích hợp an toàn trong một thời gian. Thật không may, tôi vô cùng xấu tại gossip người nổi tiếng. Mặc dù, bây giờ mà tôi nghĩ về nó, tôi đã gặp Cher một lần tại nhà của cô ở Malibu ...

Đeo ác mũ thiên tài của tôi, đây là một cách tiếp cận để xây dựng một giả thuyết lợp cỏ giả đế chế blog, đầy những bài viết cách mô phỏng tuổi teen (18-35) cô gái. Bắt đầu bằng cách giải nén cụm từ phổ biến, chủ đề, và bối cảnh từ một số blog LiveJournal và MySpace. Tiếp theo, xây dựng một số đại lý tự động viết blog giống như Weisenbaum của Eliza chương trình lai tạo với một số hiện đại chatterbots . Cuối cùng, thiết lập nó lỏng lẻo trên LiveJournal, Xanga, và MySpace và có nó bắt đầu hình thành blogrings riêng của mình và bè phái trực tuyến, đáp ứng đầu vào lọc từ ý kiến, thức ăn được lựa chọn, và tin tức tại chỗ, thiên vị cho các từ khóa nóng hiện tại và với nội dung hợp lý và thống kê liên kết ... bất kỳ Emacs Lisp và SQL tin tặc muốn thực hiện việc này trên?

Xem thêm: Outsource Blog của bạn , lý do tôi vẫn đọc báo

Cập nhật 2005/08/19 00:32 - một số cuộc thảo luận tại tim của tôi tại Accra

Cập nhật 2005/08/27 00:10 - Xem thêm thuật toán Goofy tạo ra trang web về "Cô gái ám ảnh" (tại BoingBoing), trong đó bình luận về trang web này , đó là một trong một tập hợp các trang tự động tạo ra.

BBS05 - Thứ tư

hội nghị thượng đỉnh kinh doanh blog của 2005hội nghị thượng đỉnh kinh doanh blog của 2005

Các Hội nghị cấp cao Blog kinh doanh thực sự là ngày thứ Năm và thứ Sáu, nhưng chiều nay đã có một buổi giới thiệu trên blog cho doanh nghiệp, dẫn đầu bởi Dave Taylor .

Tôi không có đối tượng mục tiêu cốt lõi cho phần này, vì tôi đã tham gia vào dự án viết blog khác nhau, nhưng nghĩ rằng nó sẽ là thú vị để nói chuyện với mọi người và được nghe câu hỏi của họ, mối quan tâm và mục tiêu liên quan đến viết blog với.

Nó cũng hữu ích để nghe người khác cố gắng giải thích blog, RSS, dịch vụ web, et al. Tôi thường xuyên thấy mình tìm kiếm một bối cảnh bắt đầu phổ biến khi nói về các chủ đề này với những người không phải là đã phần nào liên quan đến văn hóa internet và các trang web, đặc biệt là nếu họ từ các doanh nghiệp không công nghệ. Đó là đáng chú ý là các công cụ đã trở thành phổ biến như họ đang có, cho tên bất khả xâm phạm.

Tôi đã thực hiện tốt việc sử dụng các dịch vụ không dây miễn phí được cung cấp bởi AnchorFree . Họ đang chạy một captive portal yêu cầu đăng ký, vì vậy bạn sẽ cần phải đăng ký một tài khoản, nhưng đó là tốt đẹp để có. Máy tính xách tay của tôi chọn ba điểm truy cập, tất cả cường độ tín hiệu cao, có thể được cài đặt trong các phòng ở đâu đó. Đăng nhập các vị trí trong Plazes .

Hiệu suất Wirleess là okay để chậm chạp, tôi chắc chắn rằng đó là một chút quá tải; một cái gì đó giống như một nửa những người trong phòng đã có máy tính xách tay. Phiên của tôi đã giảm một vài lần, mà thiết lập lại phiên SSH của tôi và yêu cầu đăng nhập vào AnchorFree một lần nữa bằng cách sử dụng trình duyệt. Rất nhiều sự chú ý của một phần liên tục xảy ra trong căn phòng đó. Cộng với một vài người hoàn toàn bị phân tâm cố gắng để có được kết nối không dây của họ đi. Có lẽ họ nên thuê những kẻ blog của gia công phần mềm .

Bài này được gắn thẻ ( bbs05 ). Dave đã đề cập trong bài nói chuyện của mình rằng anh ta không thích họ , và nghĩ rằng họ sẽ đi xa như công cụ tìm kiếm nâng cao. Tôi đồng ý một phần. Thẻ sử dụng không quy mô tốt và hóa thân hiện tại của họ là rất tổn thương đến thư rác, nhưng trong các cộng đồng tương đối nhỏ, họ có thể là một bổ sung hiệu quả cho công cụ tìm kiếm thông thường. (Ví dụ - tôi có thể khóa một tập thơ như "haiku", hoặc "cinquain", làm cho nó có thể nhìn thấy nơi mà các văn bản thô khác có thể là khó khăn để xác định vị trí thông qua tìm kiếm.)

Cà phê chủ yếu là chạy ra sau giờ nghỉ, hy vọng họ sẽ có một nguồn cung cấp lớn hơn vào ngày mai.

Thuê ngoài Blog của bạn

Tôi đã suy đoán về một cái gì đó như thế này sau khi đọc một bài báo hồi tháng trước về gia công phần mềm bảo trì trang web cá nhân cho Ấn Độ .

thông qua cuộc cách mạng biên , nội dung để đi

Khi tôi viết entry này đối tác của tôi Jeff là trong không khí trên đường đến văn phòng của chúng tôi ở Thượng Hải. Những gì Jeff và tôi đang làm là đơn giản nhưng như xa như tôi biết chúng tôi là người đầu tiên. Chúng tôi đang gia công phần mềm blog để Trung Quốc.

Mô hình kinh doanh nói chung của chúng tôi là một nỗ lực hai tầng để thuê công dân Trung Quốc để viết blog hàng loạt cho chúng tôi tại một mức lương có giá trị. Tầng đầu tiên là tạo blog ban đầu. Những blog này sẽ bật lên trong các lĩnh vực khác nhau của mạng và xuất hiện cho người đọc vô minh được viết bởi tiêu chuẩn Mỹ của bạn. Mục tiêu ngắn hạn của chúng tôi cho các blog ban đầu là để tạo ra một dòng ổn định của doanh thu thông qua quảng cáo truyền thống như blog của google adwords. Chúng tôi ước tính blogforce hiện của chúng tôi có thể hỗ trợ 25 khoảng 500 blog không liên quan. Hy vọng rằng một vài trong số những người sẽ được truy cập. Mục tiêu dài hạn là để tạo ra một cơ chế lợp cỏ giả untraceable lớn cho ra mắt các sản phẩm khác nhau. Khi một nhà cung cấp cần phải thúc đẩy một sản phẩm mới để nhân khẩu học internet, chúng tôi sẽ có thể tạo ra một tiếng vang đáng tin cậy trên hàng trăm blog 'uy tín' và bảng tin vô số. Chúng tôi có thể cung cấp một tính hợp pháp để các nhà quảng cáo mà doesen't tồn tại bất cứ nơi nào khác.

Tầng thứ hai của kế hoạch của chúng tôi là một dịch vụ kỳ nghỉ blog, nơi các nhân viên của chúng tôi điền vào cho các blogger thành lập, những người cần mất một break từ gửi bài thường xuyên. Như tất cả các blogger biết, một blog unupdated nhanh chóng bị lãng quên. Đối với một khoản phí danh nghĩa chúng tôi có thể cung cấp tích hợp liền mạch của phụ.

Tôi không hoàn toàn chắc chắn rằng dự án là có thật, họ tuyên bố đã quyên góp được $ 5 triệu và tên miền đã được đăng ký chỉ 3 ngày trước, nhưng điều này bắt gặp ánh mắt của tôi, vì tôi nghĩ rằng có một số khả năng thực sự cho một cái gì đó như thế này.

Cá nhân, tôi không có một vấn đề với blog thương mại hoặc blog chuyên nghiệp. Tuy nhiên ... kế hoạch của họ kêu gọi xuyên tạc lợi ích thương mại như những cá nhân, trên một quy mô lớn. Đây có thể là blog của thư rác đưa đến cấp độ tiếp theo.

Nếu họ thực sự đi xuống đặt cùng một mạng nội dung blog offshored, tôi nghĩ rằng nó có thể được thực hiện mà không đi thẳng cho "quần chúng nhân dân" thị trường, mà có thể cung cấp cho nó một sự khởi đầu chậm hơn nhưng chân dài hơn.

Trong tôi mất nhanh chóng trên ý tưởng này, tôi có thể chọn Ấn Độ hay Philippines hơn Trung Quốc cho các kỹ năng ngôn ngữ tiếng Anh cơ bản, kể từ khi đối tượng mục tiêu là ở Mỹ, và có biên tập viên với những kiến ​​thức thực tế miền làm việc với các nhà văn chi phí thấp hơn. Điều này có thể không làm việc cho mô phỏng thiếu niên trang web LiveJournal, nhưng phải phù hợp khá tốt cho blog chuyên đề của hầu hết các loại. Hmm. Nghe có vẻ như sự chỉ đạo tờ báo và tạp chí kinh doanh đã được nhóm ...

Update 08-19-2005 – Followed up with more comments, plus ideas on how to build the evil astroturfing network in a new post .

Adsense

I'm doing a little experimenting with AdSense . So far most of my pages come up with ads for “Start your blog now” or “Sexy Girls & Sexy Guys”. It's interesting to see which posts trigger a keyword match. I have observed a few posts that have switched from generic blog ads to a topical ad after a followup visit from the Mediapartners-Google crawler. You'd think that a post on the Blackdog Linux Server , the Yahoo-Alibaba deal , or visiting the Mona Lisa at the Louvre would trip a keyword or two.

The banners are only on the single post templates at the moment, so you'll need to click on a post to see them. There's also a set of vertical text ads at the bottom of the sidebar. I can tell I'm probably going to end up starting on a round of site revisions by the time I'm done with this, although I'm just interested in getting a better handle on the advertising and affiliate space at the moment.

Update: 08-15-2005 23:58 – At least this post has gotten tagged with Adsense ads. It will be interesting to see which pages actually trigger clickthroughs, vs which pages get reasonable keyword tags from Adsense.

Blog Business Summit

Later this week I'll be at the Blog Business Summit in San Francisco. A discounted registration for WordPress users is available.

There's also a WordPress update released, 1.5.2 , with bug and security fixes since 1.5.1.3. It's not a platform for everyone, but I've been very pleased with the high level of support, technical flexibility, and the active developer and user communities that have evolved around WordPress in the past couple of years.

I enjoy the option of changing whatever I like in the system, but also enjoy not needing to do so most of the time.

Update 2005-08-14 17:48 – A bigger discount is available for Blogger users ! The WordPress discount is $400, the Blogger discount is $500. Hmm.