Cảnh báo: Thông số 1 để ace_where () dự kiến sẽ là một tài liệu tham khảo, giá trị được đưa ra trong /home/hjlee/hjl/hojohnlee.com/weblog/wp-includes/plugin.php on line 227

Cảnh báo: Thông số 1 để ace_join () dự kiến sẽ là một tài liệu tham khảo, giá trị được đưa ra trong /home/hjlee/hjl/hojohnlee.com/weblog/wp-includes/plugin.php on line 227
Weblog Hồ John Lee

Đánh dấu cho ngày 23 tháng một 15:00-15:00

Đây là những liên kết của tôi cho 23 tháng 1 15:00-15:00:

Đánh dấu cho ngày 20 tháng 1 thông qua ngày 23 tháng 1

Đây là những liên kết của tôi cho ngày 20 tháng 1 thông qua ngày 23 tháng 1:

  • Data.gov - Các bộ dữ liệu: Mở đại lý Chỉ thị của Chính phủ - Các bộ dữ liệu theo yêu cầu của Chỉ thị mở Chính phủ thông qua vào cuối ngày, 22 tháng 1, năm 2010. Đạo luật Tự do Thông tin yêu cầu bản ghi, Kho bạc TARP và hoạt động phái sinh nhật, tội phạm, thu nhập, nông nghiệp bộ dữ liệu.
  • Tất cả nhu cầu Twitter Bot của bạn có phải là tình yêu - tên của bot? Jason Thorton. Ông đã cùng ồn ào trong nhiều tháng nay, gửi ra trên 1.250 tweets một số 174 người theo dõi. Tweets của mình, trong khi không đặc biệt sáng tạo, quản lý được cả đáng tin cậy và kịp thời. Và ông chạy bằng một từ duy nhất: tình yêu.

    Thorton là sự sáng tạo của các nhà phát triển Ryan Merket, người đã xây dựng ông là một dự án bên trong khoảng ba giờ. Merket vừa gửi mã mà quyền anh, và cũng đã tiết lộ cách ông làm Thorton vẻ hơi thực tế: các bot tìm kiếm các tweet với chữ "tình yêu" trong họ và tweets họ như là của riêng của nó.

  • Xây dựng một Bot Twitter -.. "Gặp gỡ Jason Thorton Để người biết Jason, ông là một doanh nhân thành đạt ở San Francisco, người tweets 4-5 lần một ngày Nhưng Jason có một bí mật, anh ấy không thực sự là một con người, ông là sản phẩm của tôi thuật toán đơn giản trong PHP

    Jason tweets A LOT về chữ "tình yêu" - đó là bởi vì Jason thực sự đánh cắp tweets từ thanh thời gian công cộng có chứa từ "tình yêu" và đăng tải chúng như là của riêng mình

    Jason cũngreplies cho những người sử dụng từ "tình yêu" trong tweets của họ, và hỏi họ những câu hỏi ngẫu nhiên hoặc nói điều gì đó tùy ý

    Tôi mất khoảng 3 giờ để mã Jason, hãy tưởng tượng những gì một kỹ sư thực sự có thể làm với các thuật toán AI thực? Bây giờ nhận ra rằng nó đã là một thực tế. Các trang web như Twitter có đầy đủ các dự án phụ, sáng kiến ​​của công ty, spam bots, và robot AI. Khi dòng chảy tự do của thông tin trở nên cởi mở, số lượng tin sai tăng. Theres một nhu cầu thực sự cho một người nào đó để bác sĩ thú y người ta 'đáp ứng' trên các trang web xã hội - sẽ được thú vị để xem làm thế nào thị trường này phát triển trong các năm tiếp theo

  • Tình trạng giám sát Website - API Công Status - màn Y tế cho 26 API từ các dịch vụ Web phổ biến, bao gồm cả Google Search, Google Maps, Bing, Facebook, Twitter, SalesForce, YouTube, Amazon, eBay và những người khác
  • PG & E hệ thống điện Cúp Bản đồ - bản đồ này cho thấy sự mất hiện tại trong khu vực dịch vụ 70,000 dặm vuông của chúng tôi. Để xem chi tiết về một cúp, trong đó có nguyên nhân và thời gian dự kiến ​​phục hồi, nhấp vào biểu tượng mã màu kết hợp với cúp đó.

Đánh dấu cho ngày 20 tháng 1 thông qua ngày 22 tháng một

Đây là những liên kết của tôi cho ngày 20 tháng 1 thông qua 22 tháng 1:

  • Tất cả nhu cầu Twitter Bot của bạn có phải là tình yêu - tên của bot? Jason Thorton. Ông đã cùng ồn ào trong nhiều tháng nay, gửi ra trên 1.250 tweets một số 174 người theo dõi. Tweets của mình, trong khi không đặc biệt sáng tạo, quản lý được cả đáng tin cậy và kịp thời. Và ông chạy bằng một từ duy nhất: tình yêu.

    Thorton là sự sáng tạo của các nhà phát triển Ryan Merket, người đã xây dựng ông là một dự án bên trong khoảng ba giờ. Merket vừa gửi mã mà quyền anh, và cũng đã tiết lộ cách ông làm Thorton vẻ hơi thực tế: các bot tìm kiếm các tweet với chữ "tình yêu" trong họ và tweets họ như là của riêng của nó.

  • Xây dựng một Bot Twitter -.. "Gặp gỡ Jason Thorton Để người biết Jason, ông là một doanh nhân thành đạt ở San Francisco, người tweets 4-5 lần một ngày Nhưng Jason có một bí mật, anh ấy không thực sự là một con người, ông là sản phẩm của tôi thuật toán đơn giản trong PHP

    Jason tweets A LOT về chữ "tình yêu" - đó là bởi vì Jason thực sự đánh cắp tweets từ thanh thời gian công cộng có chứa từ "tình yêu" và đăng tải chúng như là của riêng mình

    Jason cũngreplies cho những người sử dụng từ "tình yêu" trong tweets của họ, và hỏi họ những câu hỏi ngẫu nhiên hoặc nói điều gì đó tùy ý

    Tôi mất khoảng 3 giờ để mã Jason, hãy tưởng tượng những gì một kỹ sư thực sự có thể làm với các thuật toán AI thực? Bây giờ nhận ra rằng nó đã là một thực tế. Các trang web như Twitter có đầy đủ các dự án phụ, sáng kiến ​​của công ty, spam bots, và robot AI. Khi dòng chảy tự do của thông tin trở nên cởi mở, số lượng tin sai tăng. Theres một nhu cầu thực sự cho một người nào đó để bác sĩ thú y người ta 'đáp ứng' trên các trang web xã hội - sẽ được thú vị để xem làm thế nào thị trường này phát triển trong các năm tiếp theo

  • Tình trạng giám sát Website - API Công Status - màn Y tế cho 26 API từ các dịch vụ Web phổ biến, bao gồm cả Google Search, Google Maps, Bing, Facebook, Twitter, SalesForce, YouTube, Amazon, eBay và những người khác
  • PG & E hệ thống điện Cúp Bản đồ - bản đồ này cho thấy sự mất hiện tại trong khu vực dịch vụ 70,000 dặm vuông của chúng tôi. Để xem chi tiết về một cúp, trong đó có nguyên nhân và thời gian dự kiến ​​phục hồi, nhấp vào biểu tượng mã màu kết hợp với cúp đó.

Đánh dấu cho ngày 20 tháng một 10:26-14:12

Đây là những liên kết của tôi cho ngày 20 tháng một 10:26-14:12:

  • Tình trạng giám sát Website - API Công Status - màn Y tế cho 26 API từ các dịch vụ Web phổ biến, bao gồm cả Google Search, Google Maps, Bing, Facebook, Twitter, SalesForce, YouTube, Amazon, eBay và những người khác
  • PG & E hệ thống điện Cúp Bản đồ - bản đồ này cho thấy sự mất hiện tại trong khu vực dịch vụ 70,000 dặm vuông của chúng tôi. Để xem chi tiết về một cúp, trong đó có nguyên nhân và thời gian dự kiến ​​phục hồi, nhấp vào biểu tượng mã màu kết hợp với cúp đó.

Đánh dấu cho ngày 20 tháng một 10:26-10:26

Đây là những liên kết của tôi cho ngày 20 tháng một 10:26-10:26:

  • PG & E hệ thống điện Cúp Bản đồ - bản đồ này cho thấy sự mất hiện tại trong khu vực dịch vụ 70,000 dặm vuông của chúng tôi. Để xem chi tiết về một cúp, trong đó có nguyên nhân và thời gian dự kiến ​​phục hồi, nhấp vào biểu tượng mã màu kết hợp với cúp đó.

Đánh dấu cho ngày 17 tháng 1 thông qua ngày 20 tháng 1

Đây là những liên kết của tôi cho ngày 17 tháng 1 thông qua ngày 20 tháng 1:

  • PG & E hệ thống điện Cúp Bản đồ - bản đồ này cho thấy sự mất hiện tại trong khu vực dịch vụ 70,000 dặm vuông của chúng tôi. Để xem chi tiết về một cúp, trong đó có nguyên nhân và thời gian dự kiến ​​phục hồi, nhấp vào biểu tượng mã màu kết hợp với cúp đó.
  • Twitter.com vs The Twitter Hệ sinh thái - Fred Wilson bình luận về một số dữ liệu từ John Borthwick chỉ Twitter sử dụng hệ sinh thái = 3-5x Twitter.com trực tiếp.

    "John biểu đồ ước tính có khoảng 20mm Twitter.com Uvs một tháng tại Mỹ (comScore có nó ở 60mm UV trên toàn thế giới) và các hệ sinh thái Twitter vào khoảng 60mm UV ở Mỹ.

    Điều đó nói rằng trên tất cả các dịch vụ web, không chỉ AVC, các hệ sinh thái Twitter là về 3x Twitter.com. Và trên blog này, có khán giả chắc chắn là người sử dụng điện, tỷ lệ đó là 5x. "

  • Chris Walshaw :: Lưu Trữ :: Nghiên cứu phân vùng - Chào mừng đến với Đại học Greenwich Graph Phân vùng Archive. Các kho lưu trữ bao gồm các phân vùng tốt nhất tìm thấy cho đến nay cho một loạt các biểu đồ và mục đích của nó là cung cấp một chuẩn mực, dựa vào đó các thuật toán phân vùng có thể được kiểm tra, và một nguồn tài nguyên để thử nghiệm.

    Các kho lưu trữ phân vùng đã đi vào hoạt động từ năm 2000 và bao gồm kết quả từ hầu hết các gói phần mềm phân vùng đồ thị lớn. Các nhà nghiên cứu phát triển các thuật toán phân vùng thử nghiệm thường xuyên trình phân vùng mới để đưa vào có thể.

    Hầu hết các biểu đồ thử nghiệm phát sinh từ các ứng dụng phân vùng điển hình, mặc dù các kho lưu trữ cũng bao gồm các kết quả tính toán cho một bộ kiểm tra đồ thị màu [Wal04] chứa trong một phụ lục riêng biệt.

    Các kho lưu trữ ban đầu được thành lập như là một phần của một dự án nghiên cứu phân vùng chất lượng rất cao và tác giả có nhu cầu tham khảo các phân vùng lưu trữ nên trích dẫn bài báo [SWC04].

  • Thu thập thông tin «The Guy của Twitter sản phẩm - "Một danh sách các sự cố ảnh hưởng đến Thời gian tải trang của các sản phẩm Twitter, phân biệt giữa tổng thời gian chết, và một phần thời gian chết và không thể tiếp cận thông tin, dựa trên các bài đăng công khai trên blog Twitter.

    http://status.twitter.com/archive

    Tôi đã làm hết sức mình để không tăng gấp đôi tính bất kỳ vấn đề, nhưng rất khó vì nhiều vấn đề xảy ra rất thường xuyên, và nó thường rất khó để phân biệt, từ các bài đăng trên blog trạng thái một mình, giữa một vấn đề sự bền bỉ được kinh nghiệm hoặc cố định, từ đó của một sự xuất hiện mới của một vấn đề tương tự hoặc tương tự. Hơn nữa, tôi cũng loại trừ các tác động về thời gian tải trang phát sinh từ dự kiến ​​bảo trì / ngưng hoạt động - thời kỳ của thời gian mà kỳ vọng người dùng sẽ được phù hợp nhất với lời hứa của sản phẩm của thời gian tải trang. "

  • Soundboard.com - Soundboard.com là danh mục lớn nhất của web của âm thanh miễn phí và soundboards - trong hơn 20 loại, cho điện thoại di động hoặc máy tính. 252.858 âm thanh miễn phí trên 17.171 soundboards từ phim ảnh đến thể thao, hiệu ứng âm thanh, truyền hình, những người nổi tiếng, lịch sử và du lịch. Hoặc xây dựng, tùy chỉnh, nhúng và quản lý riêng của bạn

Đánh dấu cho ngày 17 tháng 1 thông qua ngày 20 tháng 1

Đây là những liên kết của tôi cho ngày 17 tháng 1 thông qua ngày 20 tháng 1:

  • PG & E hệ thống điện Cúp Bản đồ - bản đồ này cho thấy sự mất hiện tại trong khu vực dịch vụ 70,000 dặm vuông của chúng tôi. Để xem chi tiết về một cúp, trong đó có nguyên nhân và thời gian dự kiến ​​phục hồi, nhấp vào biểu tượng mã màu kết hợp với cúp đó.
  • Twitter.com vs The Twitter Hệ sinh thái - Fred Wilson bình luận về một số dữ liệu từ John Borthwick chỉ Twitter sử dụng hệ sinh thái = 3-5x Twitter.com trực tiếp.

    "John biểu đồ ước tính có khoảng 20mm Twitter.com Uvs một tháng tại Mỹ (comScore có nó ở 60mm UV trên toàn thế giới) và các hệ sinh thái Twitter vào khoảng 60mm UV ở Mỹ.

    Điều đó nói rằng trên tất cả các dịch vụ web, không chỉ AVC, các hệ sinh thái Twitter là về 3x Twitter.com. Và trên blog này, có khán giả chắc chắn là người sử dụng điện, tỷ lệ đó là 5x. "

  • Chris Walshaw :: Lưu Trữ :: Nghiên cứu phân vùng - Chào mừng đến với Đại học Greenwich Graph Phân vùng Archive. Các kho lưu trữ bao gồm các phân vùng tốt nhất tìm thấy cho đến nay cho một loạt các biểu đồ và mục đích của nó là cung cấp một chuẩn mực, dựa vào đó các thuật toán phân vùng có thể được kiểm tra, và một nguồn tài nguyên để thử nghiệm.

    Các kho lưu trữ phân vùng đã đi vào hoạt động từ năm 2000 và bao gồm kết quả từ hầu hết các gói phần mềm phân vùng đồ thị lớn. Các nhà nghiên cứu phát triển các thuật toán phân vùng thử nghiệm thường xuyên trình phân vùng mới để đưa vào có thể.

    Hầu hết các biểu đồ thử nghiệm phát sinh từ các ứng dụng phân vùng điển hình, mặc dù các kho lưu trữ cũng bao gồm các kết quả tính toán cho một bộ kiểm tra đồ thị màu [Wal04] chứa trong một phụ lục riêng biệt.

    Các kho lưu trữ ban đầu được thành lập như là một phần của một dự án nghiên cứu phân vùng chất lượng rất cao và tác giả có nhu cầu tham khảo các phân vùng lưu trữ nên trích dẫn bài báo [SWC04].

  • Thu thập thông tin «The Guy của Twitter sản phẩm - "Một danh sách các sự cố ảnh hưởng đến Thời gian tải trang của các sản phẩm Twitter, phân biệt giữa tổng thời gian chết, và một phần thời gian chết và không thể tiếp cận thông tin, dựa trên các bài đăng công khai trên blog Twitter.

    http://status.twitter.com/archive

    Tôi đã làm hết sức mình để không tăng gấp đôi tính bất kỳ vấn đề, nhưng rất khó vì nhiều vấn đề xảy ra rất thường xuyên, và nó thường rất khó để phân biệt, từ các bài đăng trên blog trạng thái một mình, giữa một vấn đề sự bền bỉ được kinh nghiệm hoặc cố định, từ đó của một sự xuất hiện mới của một vấn đề tương tự hoặc tương tự. Hơn nữa, tôi cũng loại trừ các tác động về thời gian tải trang phát sinh từ dự kiến ​​bảo trì / ngưng hoạt động - thời kỳ của thời gian mà kỳ vọng người dùng sẽ được phù hợp nhất với lời hứa của sản phẩm của thời gian tải trang. "

  • Soundboard.com - Soundboard.com là danh mục lớn nhất của web của âm thanh miễn phí và soundboards - trong hơn 20 loại, cho điện thoại di động hoặc máy tính. 252.858 âm thanh miễn phí trên 17.171 soundboards từ phim ảnh đến thể thao, hiệu ứng âm thanh, truyền hình, những người nổi tiếng, lịch sử và du lịch. Hoặc xây dựng, tùy chỉnh, nhúng và quản lý riêng của bạn

Đánh dấu cho ngày 17 tháng 1 thông qua ngày 18 tháng 1

Đây là những liên kết của tôi cho ngày 17 tháng 1 thông qua ngày 18 tháng 1:

  • Twitter.com vs The Twitter Hệ sinh thái - Fred Wilson bình luận về một số dữ liệu từ John Borthwick chỉ Twitter sử dụng hệ sinh thái = 3-5x Twitter.com trực tiếp.

    "John biểu đồ ước tính có khoảng 20mm Twitter.com Uvs một tháng tại Mỹ (comScore có nó ở 60mm UV trên toàn thế giới) và các hệ sinh thái Twitter vào khoảng 60mm UV ở Mỹ.

    Điều đó nói rằng trên tất cả các dịch vụ web, không chỉ AVC, các hệ sinh thái Twitter là về 3x Twitter.com. Và trên blog này, có khán giả chắc chắn là người sử dụng điện, tỷ lệ đó là 5x. "

  • Chris Walshaw :: Lưu Trữ :: Nghiên cứu phân vùng - Chào mừng đến với Đại học Greenwich Graph Phân vùng Archive. Các kho lưu trữ bao gồm các phân vùng tốt nhất tìm thấy cho đến nay cho một loạt các biểu đồ và mục đích của nó là cung cấp một chuẩn mực, dựa vào đó các thuật toán phân vùng có thể được kiểm tra, và một nguồn tài nguyên để thử nghiệm.

    Các kho lưu trữ phân vùng đã đi vào hoạt động từ năm 2000 và bao gồm kết quả từ hầu hết các gói phần mềm phân vùng đồ thị lớn. Các nhà nghiên cứu phát triển các thuật toán phân vùng thử nghiệm thường xuyên trình phân vùng mới để đưa vào có thể.

    Hầu hết các biểu đồ thử nghiệm phát sinh từ các ứng dụng phân vùng điển hình, mặc dù các kho lưu trữ cũng bao gồm các kết quả tính toán cho một bộ kiểm tra đồ thị màu [Wal04] chứa trong một phụ lục riêng biệt.

    Các kho lưu trữ ban đầu được thành lập như là một phần của một dự án nghiên cứu phân vùng chất lượng rất cao và tác giả có nhu cầu tham khảo các phân vùng lưu trữ nên trích dẫn bài báo [SWC04].

  • Thu thập thông tin «The Guy của Twitter sản phẩm - "Một danh sách các sự cố ảnh hưởng đến Thời gian tải trang của các sản phẩm Twitter, phân biệt giữa tổng thời gian chết, và một phần thời gian chết và không thể tiếp cận thông tin, dựa trên các bài đăng công khai trên blog Twitter.

    http://status.twitter.com/archive

    Tôi đã làm hết sức mình để không tăng gấp đôi tính bất kỳ vấn đề, nhưng rất khó vì nhiều vấn đề xảy ra rất thường xuyên, và nó thường rất khó để phân biệt, từ các bài đăng trên blog trạng thái một mình, giữa một vấn đề sự bền bỉ được kinh nghiệm hoặc cố định, từ đó của một sự xuất hiện mới của một vấn đề tương tự hoặc tương tự. Hơn nữa, tôi cũng loại trừ các tác động về thời gian tải trang phát sinh từ dự kiến ​​bảo trì / ngưng hoạt động - thời kỳ của thời gian mà kỳ vọng người dùng sẽ được phù hợp nhất với lời hứa của sản phẩm của thời gian tải trang. "

  • Soundboard.com - Soundboard.com là danh mục lớn nhất của web của âm thanh miễn phí và soundboards - trong hơn 20 loại, cho điện thoại di động hoặc máy tính. 252.858 âm thanh miễn phí trên 17.171 soundboards từ phim ảnh đến thể thao, hiệu ứng âm thanh, truyền hình, những người nổi tiếng, lịch sử và du lịch. Hoặc xây dựng, tùy chỉnh, nhúng và quản lý riêng của bạn

Đánh dấu cho ngày 17 tháng 1 thông qua ngày 18 tháng 1

Đây là những liên kết của tôi cho ngày 17 tháng 1 thông qua ngày 18 tháng 1:

  • Twitter.com vs The Twitter Hệ sinh thái - Fred Wilson bình luận về một số dữ liệu từ John Borthwick chỉ Twitter sử dụng hệ sinh thái = 3-5x Twitter.com trực tiếp.

    "John biểu đồ ước tính có khoảng 20mm Twitter.com Uvs một tháng tại Mỹ (comScore có nó ở 60mm UV trên toàn thế giới) và các hệ sinh thái Twitter vào khoảng 60mm UV ở Mỹ.

    Điều đó nói rằng trên tất cả các dịch vụ web, không chỉ AVC, các hệ sinh thái Twitter là về 3x Twitter.com. Và trên blog này, có khán giả chắc chắn là người sử dụng điện, tỷ lệ đó là 5x. "

  • Chris Walshaw :: Lưu Trữ :: Nghiên cứu phân vùng - Chào mừng đến với Đại học Greenwich Graph Phân vùng Archive. Các kho lưu trữ bao gồm các phân vùng tốt nhất tìm thấy cho đến nay cho một loạt các biểu đồ và mục đích của nó là cung cấp một chuẩn mực, dựa vào đó các thuật toán phân vùng có thể được kiểm tra, và một nguồn tài nguyên để thử nghiệm.

    Các kho lưu trữ phân vùng đã đi vào hoạt động từ năm 2000 và bao gồm kết quả từ hầu hết các gói phần mềm phân vùng đồ thị lớn. Các nhà nghiên cứu phát triển các thuật toán phân vùng thử nghiệm thường xuyên trình phân vùng mới để đưa vào có thể.

    Hầu hết các biểu đồ thử nghiệm phát sinh từ các ứng dụng phân vùng điển hình, mặc dù các kho lưu trữ cũng bao gồm các kết quả tính toán cho một bộ kiểm tra đồ thị màu [Wal04] chứa trong một phụ lục riêng biệt.

    Các kho lưu trữ ban đầu được thành lập như là một phần của một dự án nghiên cứu phân vùng chất lượng rất cao và tác giả có nhu cầu tham khảo các phân vùng lưu trữ nên trích dẫn bài báo [SWC04].

  • Thu thập thông tin «The Guy của Twitter sản phẩm - "Một danh sách các sự cố ảnh hưởng đến Thời gian tải trang của các sản phẩm Twitter, phân biệt giữa tổng thời gian chết, và một phần thời gian chết và không thể tiếp cận thông tin, dựa trên các bài đăng công khai trên blog Twitter.

    http://status.twitter.com/archive

    Tôi đã làm hết sức mình để không tăng gấp đôi tính bất kỳ vấn đề, nhưng rất khó vì nhiều vấn đề xảy ra rất thường xuyên, và nó thường rất khó để phân biệt, từ các bài đăng trên blog trạng thái một mình, giữa một vấn đề sự bền bỉ được kinh nghiệm hoặc cố định, từ đó của một sự xuất hiện mới của một vấn đề tương tự hoặc tương tự. Hơn nữa, tôi cũng loại trừ các tác động về thời gian tải trang phát sinh từ dự kiến ​​bảo trì / ngưng hoạt động - thời kỳ của thời gian mà kỳ vọng người dùng sẽ được phù hợp nhất với lời hứa của sản phẩm của thời gian tải trang. "

  • Soundboard.com - Soundboard.com là danh mục lớn nhất của web của âm thanh miễn phí và soundboards - trong hơn 20 loại, cho điện thoại di động hoặc máy tính. 252.858 âm thanh miễn phí trên 17.171 soundboards từ phim ảnh đến thể thao, hiệu ứng âm thanh, truyền hình, những người nổi tiếng, lịch sử và du lịch. Hoặc xây dựng, tùy chỉnh, nhúng và quản lý riêng của bạn

Đánh dấu cho ngày 17 tháng 1 thông qua ngày 18 tháng 1

Đây là những liên kết của tôi cho ngày 17 tháng 1 thông qua ngày 18 tháng 1:

  • Twitter.com vs The Twitter Hệ sinh thái - Fred Wilson bình luận về một số dữ liệu từ John Borthwick chỉ Twitter sử dụng hệ sinh thái = 3-5x Twitter.com trực tiếp.

    "John biểu đồ ước tính có khoảng 20mm Twitter.com Uvs một tháng tại Mỹ (comScore có nó ở 60mm UV trên toàn thế giới) và các hệ sinh thái Twitter vào khoảng 60mm UV ở Mỹ.

    Điều đó nói rằng trên tất cả các dịch vụ web, không chỉ AVC, các hệ sinh thái Twitter là về 3x Twitter.com. Và trên blog này, có khán giả chắc chắn là người sử dụng điện, tỷ lệ đó là 5x. "

  • Chris Walshaw :: Lưu Trữ :: Nghiên cứu phân vùng - Chào mừng đến với Đại học Greenwich Graph Phân vùng Archive. Các kho lưu trữ bao gồm các phân vùng tốt nhất tìm thấy cho đến nay cho một loạt các biểu đồ và mục đích của nó là cung cấp một chuẩn mực, dựa vào đó các thuật toán phân vùng có thể được kiểm tra, và một nguồn tài nguyên để thử nghiệm.

    Các kho lưu trữ phân vùng đã đi vào hoạt động từ năm 2000 và bao gồm kết quả từ hầu hết các gói phần mềm phân vùng đồ thị lớn. Các nhà nghiên cứu phát triển các thuật toán phân vùng thử nghiệm thường xuyên trình phân vùng mới để đưa vào có thể.

    Hầu hết các biểu đồ thử nghiệm phát sinh từ các ứng dụng phân vùng điển hình, mặc dù các kho lưu trữ cũng bao gồm các kết quả tính toán cho một bộ kiểm tra đồ thị màu [Wal04] chứa trong một phụ lục riêng biệt.

    Các kho lưu trữ ban đầu được thành lập như là một phần của một dự án nghiên cứu phân vùng chất lượng rất cao và tác giả có nhu cầu tham khảo các phân vùng lưu trữ nên trích dẫn bài báo [SWC04].

  • Thu thập thông tin «The Guy của Twitter sản phẩm - "Một danh sách các sự cố ảnh hưởng đến Thời gian tải trang của các sản phẩm Twitter, phân biệt giữa tổng thời gian chết, và một phần thời gian chết và không thể tiếp cận thông tin, dựa trên các bài đăng công khai trên blog Twitter.

    http://status.twitter.com/archive

    Tôi đã làm hết sức mình để không tăng gấp đôi tính bất kỳ vấn đề, nhưng rất khó vì nhiều vấn đề xảy ra rất thường xuyên, và nó thường rất khó để phân biệt, từ các bài đăng trên blog trạng thái một mình, giữa một vấn đề sự bền bỉ được kinh nghiệm hoặc cố định, từ đó của một sự xuất hiện mới của một vấn đề tương tự hoặc tương tự. Hơn nữa, tôi cũng loại trừ các tác động về thời gian tải trang phát sinh từ dự kiến ​​bảo trì / ngưng hoạt động - thời kỳ của thời gian mà kỳ vọng người dùng sẽ được phù hợp nhất với lời hứa của sản phẩm của thời gian tải trang. "

  • Soundboard.com - Soundboard.com là danh mục lớn nhất của web của âm thanh miễn phí và soundboards - trong hơn 20 loại, cho điện thoại di động hoặc máy tính. 252.858 âm thanh miễn phí trên 17.171 soundboards từ phim ảnh đến thể thao, hiệu ứng âm thanh, truyền hình, những người nổi tiếng, lịch sử và du lịch. Hoặc xây dựng, tùy chỉnh, nhúng và quản lý riêng của bạn

Đánh dấu cho ngày 17 tháng 1 21:37-21:53

Đây là những liên kết của tôi cho ngày 17 tháng 1 21:37-21:53:

  • Thu thập thông tin «The Guy của Twitter sản phẩm - "Một danh sách các sự cố ảnh hưởng đến Thời gian tải trang của các sản phẩm Twitter, phân biệt giữa tổng thời gian chết, và một phần thời gian chết và không thể tiếp cận thông tin, dựa trên các bài đăng công khai trên blog Twitter.

    http://status.twitter.com/archive

    Tôi đã làm hết sức mình để không tăng gấp đôi tính bất kỳ vấn đề, nhưng rất khó vì nhiều vấn đề xảy ra rất thường xuyên, và nó thường rất khó để phân biệt, từ các bài đăng trên blog trạng thái một mình, giữa một vấn đề sự bền bỉ được kinh nghiệm hoặc cố định, từ đó của một sự xuất hiện mới của một vấn đề tương tự hoặc tương tự. Hơn nữa, tôi cũng loại trừ các tác động về thời gian tải trang phát sinh từ dự kiến ​​bảo trì / ngưng hoạt động - thời kỳ của thời gian mà kỳ vọng người dùng sẽ được phù hợp nhất với lời hứa của sản phẩm của thời gian tải trang. "

  • Soundboard.com - Soundboard.com là danh mục lớn nhất của web của âm thanh miễn phí và soundboards - trong hơn 20 loại, cho điện thoại di động hoặc máy tính. 252.858 âm thanh miễn phí trên 17.171 soundboards từ phim ảnh đến thể thao, hiệu ứng âm thanh, truyền hình, những người nổi tiếng, lịch sử và du lịch. Hoặc xây dựng, tùy chỉnh, nhúng và quản lý riêng của bạn

Bookmarks cho 31 tháng 12 thông qua ngày 17 tháng một

Đây là những liên kết của tôi cho ngày 31 tháng 12 đến tháng 17:

  • Khan Academy - Học viện Khan là một tổ chức phi lợi nhuận có nhiệm vụ cung cấp một nền giáo dục chất lượng cao cho bất cứ ai, bất cứ nơi nào.

    Chúng tôi có hơn 1000 video trên YouTube bao gồm tất cả mọi thứ từ số học cơ bản và đại số để phương trình vi phân, vật lý, hóa học, sinh học và tài chính đã được ghi lại bởi Salman Khan.

  • AI Cạnh tranh StarCraft | biểu cảm Intelligence Studio - AI cạnh tranh chiến tranh bot sử dụng một API hack để chạy StarCraft, sẽ được tổ chức tại AIIDE2010 trong tháng 10 năm 2010.
    Sự cạnh tranh sẽ sử dụng StarCraft Brood War 1.16.1. Bots cho StarCraft có thể được phát triển bằng cách sử dụng API Broodwar, cung cấp móc vào StarCraft và cho phép sự phát triển của các tùy chỉnh AI cho StarCraft. Một giao diện C ++ cho phép các nhà phát triển để truy vấn trạng thái hiện tại của trò chơi và vấn đề đơn đặt hàng cho các đơn vị. Giới thiệu về các API Broodwar có sẵn ở đây. Hướng dẫn xây dựng một bot giao tiếp với một quá trình từ xa có sẵn ở đây. Ngoài ra còn có một diễn đàn. Chúng tôi khuyến khích nộp chương trình mà sử dụng các kỹ thuật tiên tiến AI. Một số ý kiến ​​là:
    * Kế hoạch
    * Khai thác dữ liệu
    * Máy học
    * Case-Based Reasoning
  • Các biện pháp đo: Tìm hiểu về học thống kê - Một "hướng dẫn bắt đầu nhanh" cho hệ thống học tập thống kê và máy móc, bộ sưu tập tốt của các tài liệu tham khảo.
  • Berkowitz et al: Việc sử dụng các phương pháp chính thức để lập bản đồ, phân tích và giải thích hawala và hệ thống chuyển tiền thay thế khủng bố liên quan (2006) - Berkowitz, Steven D., Woodward, Lloyd H., & Woodward, Caitlin. (2006). Sử dụng các phương pháp chính thức để lập bản đồ, phân tích và giải thích hawala và hệ thống chuyển tiền thay thế khủng bố liên quan. Ban đầu dự định cho xuất bản trong việc cập nhật số lượng năm 1988, eds, Wellman và Berkowitz, cấu trúc xã hội:. Một cách tiếp cận mạng (Cambridge University Press). Steve đã chết vào tháng Mười, năm 2003. Xem Barry Wellman của "Steve Berkowitz: Một Pioneer mạng đã qua đời," trong Connections 25 (2), năm 2003. Nó đã không thể thêm việc cập nhật các tài liệu tham khảo hoặc về chất lượng đồ họa mà có thể có được, nếu Berkowitz còn sống. Một phiên bản của bài báo xuất hiện trong Kỷ yếu của kỳ họp về chống khủng bố Networks: Nghiên cứu hiện tại trong xã hội Phân tích mạng lưới cho các chiến Môi trường chiến mới. 8 Tư lệnh Quốc tế và Nghiên cứu Quản lý và Công nghệ Hội nghị chuyên đề. Đại học Quốc phòng Quốc gia, Washington, DC ngày 17-ngày 19 Tháng Sáu, 2003
  • SSH Tunneling thông qua bộ lọc web | s-anand.net - Từng bước hướng dẫn về sử dụng Putty và một thể hiện EC2 để thiết lập một proxy web tin theo yêu cầu.
  • PyDroid GUI bộ công cụ tự động hóa - GitHub - Pydroid là gì?

    Pydroid là một bộ công cụ đơn giản để tự động hoá và kịch bản các nhiệm vụ lặp đi lặp lại, đặc biệt là những người có liên quan đến một giao diện đồ họa, với Python. Nó bao gồm các chức năng để kiểm soát chuột và bàn phím, tìm màu sắc và bitmap trên màn hình, cũng như hiển thị các cảnh báo cross-nền tảng.
    Tại sao sử dụng Pydroid?

    * Kiểm tra một ứng dụng giao diện cho các lỗi và các trường hợp cạnh
    o Bạn có thể nghĩ rằng ứng dụng của bạn là ổn định, nhưng những gì sẽ xảy ra nếu bạn bấm nút 5000 lần?
    * Tự động trò chơi
    o Viết một kịch bản để đánh bại đó trò chơi flash crappy thể có nhiều hơn hài lòng hơn so với chi tiêu giờ chơi nó cho mình.
    * Freaking ra bạn bè và gia đình
    o Vâng, có lẽ đây không phải là thực sự là một ứng dụng thực tế, nhưng ...

  • Thời Gian Thư Viện Data Series - Nhiều bộ dữ liệu - "Đây là một bộ sưu tập khoảng 800 gian hàng loạt rút ra từ nhiều khác nhau fields.Agriculture Hóa học Crime Nhân khẩu học Sinh thái học Tài chính Y tế Công nghiệp Thủy văn Thị trường Lao động-Macro Economics Khí tượng Micro-Kinh tế Miscellaneous Vật lý sản xuất kinh doanh Simulated loạt Sport Vận tải & Du lịch Tree-nhẫn Utilities "
  • Làm thế nào nhiều thông tin là Twitter? »SemanticHacker Blog -.. "Chúng tôi đã tiến hành một nghiên cứu nhỏ để mô tả các loại thông tin khác nhau mà có thể được tìm thấy trên Twitter Chúng tôi đã tải một mẫu của tweets trong khoảng thời gian hai tuần sử dụng Twitter trực API này dẫn đến một corpus của 8,9 triệu tin nhắn ("tweets") đăng trên 2,6 triệu người sử dụng. Về 2.700.000 các tweets, hay 31%, đã trả lời một tweet gửi bởi một người dùng khác, trong khi nửa triệu (6%) là retweets. Gần 2 triệu USD (22 %) của các tin nhắn có chứa một URL. "
  • Gremlin - một Turing hoàn tất, biểu đồ dựa trên ngôn ngữ lập trình - GitHub - Gremlin là một Turing hoàn tất, biểu đồ dựa trên ngôn ngữ lập trình được phát triển trong Java 1.6 + cho khóa / giá trị cặp đồ thị đa quan hệ được gọi là đồ thị bất động sản. Gremlin làm cho sử dụng rộng rãi trong những ngôn ngữ XPath 1.0 để hỗ trợ traversals đồ thị phức tạp. Ngôn ngữ này có ứng dụng trong các lĩnh vực của đồ thị truy vấn, phân tích, và thao tác. Connectors tồn tại cho các hệ thống quản lý dữ liệu sau đây:

    * TinkerGraph trong bộ nhớ đồ thị
    * Neo4j đồ thị cơ sở dữ liệu
    * Sesame 2.0 cửa hàng RDF compliant
    * Cơ sở dữ liệu tài liệu MongoDB

    Các tài liệu cho Gremlin có thể được tìm thấy tại địa điểm này. Cuối cùng, xin vui lòng ghé thăm TinkerPop cho các sản phẩm phần mềm khác.

  • Các ngôn ngữ lập trình C: 4.10 - bởi Kernighan & Ritchie & Lovecraft - làm mất hiệu lực Rlyeh
    (Int mene [], int wgah, int nagl) {
    int Ia, fhtagn;
    if (wgah> = nagl) return;
    swap (mene, wgah, (wgah + nagl) / 2);
    fhtagn = wgah;
    for (Ia = wgah + 1; Ia <= nagl; Ia ++)
    if (mene [Ia] <mene [wgah])
    swap (mene, ++ fhtagn, Ia);
    swap (mene, wgah, fhtagn);
    Rlyeh (mene, wgah, fhtagn-1);
    Rlyeh (mene, fhtagn + 1, nagl);

    } // PH'NGLUI MGLW'NAFH Cthulhu!

  • Làm thế nào để chuyển đổi địa chỉ email vào tên, tuổi, dân tộc, định hướng tình dục - Điều này là rất Meta - "Lưu danh sách email của bạn như là một tập tin CSV (chỉ cần dấu phẩy phân cách các địa chỉ email) Tải lên tập tin này vào tài khoản facebook của bạn nếu như bạn muốn. thêm chúng như những người bạn. Thì đấy, facebook sẽ cung cấp cho bạn tất cả các hồ sơ của tất cả những người sử dụng (trong thử nghiệm của tôi, khoảng 80% trong danh sách email của tôi có cấu facebook). Bây giờ, nhấp chuột qua mỗi hồ sơ, và bởi vì các thiết lập mặc định facebook mới , mà làm cho tất cả các công bố thông tin, khoảng 95% số người sử dụng thông tin có sẵn để bạn có thể thu hoạch. "
  • Microsoft Security Development Lifecycle (SDL): Công cụ Repository - Một bộ sưu tập trước đây chỉ dành cho nội công cụ bảo mật từ Microsoft, bao gồm chống XSS, kiểm tra lông tơ, FxCop, mô hình hóa mối đe dọa, binscope, bây giờ đã có thể download miễn phí.
  • Analytics X Prize - Home - Dự báo tỷ lệ giết người ở Philadelphia - Giải Analytics X là một cuộc thi đang diễn ra để áp dụng phân tích, mô hình hóa, và thống kê để giải quyết các vấn đề xã hội có ảnh hưởng đến các thành phố của chúng tôi. Nó kết hợp các lĩnh vực thống kê, toán học, và khoa học xã hội để hiểu rõ nguyên nhân gốc rễ của rối loạn chức năng trong các khu phố của chúng tôi. Hiểu được những mối quan hệ và phát hiện các biến cao nhất tương quan cho phép chúng ta triển khai nguồn lực giới hạn của mình hiệu quả hơn và nhắm mục tiêu các biến sẽ có những tác động tích cực lớn nhất về cải thiện.
  • PeteSearch: Làm thế nào để tìm kiếm thông tin người sử dụng từ một địa chỉ email - FindByEmail đang phát hành như là mã nguồn mở. Bạn vượt qua nó một địa chỉ email, và nó truy vấn 11 API công cộng khác nhau để khám phá những dịch vụ thông tin gì có trên người sử dụng với địa chỉ email.
  • Các biện pháp đo: Beyond PageRank: Học tập với nội dung và Networks - Kết luận: học dựa trên các nội dung và dữ liệu mạng là tình trạng hiện nay của nghệ thuật còn có một tờ giấy lớn và nói về cá nhân trong Google News rằng họ sử dụng nội dung cho mục đích này, và sau đó người dùng nhấp vào dòng để cung cấp cá nhân, tức là giới thiệu các bài báo cụ thể trong từng cụm chủ đề. Vấn đề là lọc nội dung là thường (như chúng tôi nói trong nghiên cứu) "cách khó khăn hơn." Giả sử bạn có một đồ thị xã hội, một loạt các văn bản, và bạn biết rằng một số người dùng trong đồ thị xã hội như một số tài liệu, và bạn muốn giới thiệu các tài liệu khác mà bạn nghĩ họ sẽ thích. Sử dụng phương pháp tiếp cận dựa trên mạng, bạn có thể xem xét việc phân nhóm người dùng dựa trên sự hợp visitaion (họ đã cùng thích một số các văn bản). Này quy mô lớn, và nó internationalizes tuyệt vời. Nếu bạn bắt đầu giải nén các tính năng từ các văn tự, thì những gì bạn xây dựng cho tiếng Anh có thể không làm việc tốt cho thị trường Trung Quốc. Ngoài ra, có rất nhiều dữ liệu trong các văn bản hơn là trong đồ thị xã hội
  • mikemaccana's python-docx at master – GitHub – MIT-licensed Python library to read/write Microsoft Word docx format files. "The docx module reads and writes Microsoft Office Word 2007 docx files. These are referred to as 'WordML', 'Office Open XML' and 'Open XML' by Microsoft. They can be opened in Microsoft Office 2007, Microsoft Mac Office 2008, OpenOffice.org 2.2, and Apple iWork 08. The module was created when I was looking for a Python support for MS Word .doc files, but could only find various hacks involving COM automation, calling .net or Java, or automating OpenOffice or MS Office."

Bookmarks for December 31st through January 16th

These are my links for December 31st through January 16th:

  • StarCraft AI Competition | Expressive Intelligence Studio – AI bot warfare competition using a hacked API to run StarCraft, will be held at AIIDE2010 in October 2010.
    The competition will use StarCraft Brood War 1.16.1. Bots for StarCraft can be developed using the Broodwar API, which provides hooks into StarCraft and enables the development of custom AI for StarCraft. A C++ interface enables developers to query the current state of the game and issue orders to units. An introduction to the Broodwar API is available here. Instructions for building a bot that communicates with a remote process are available here. There is also a Forum. We encourage submission of bots that make use of advanced AI techniques. Some ideas are:
    * Planning
    * Data Mining
    * Machine Learning
    * Case-Based Reasoning
  • Measuring Measures: Learning About Statistical Learning – A "quick start guide" for statistical and machine learning systems, good collection of references.
  • Berkowitz et al : The use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems (2006) – Berkowitz, Steven D., Woodward, Lloyd H., & Woodward, Caitlin. (2006). Use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems. Originally intended for publication in updating the 1988 volume, eds., Wellman and Berkowitz, Social Structures: A Network Approach (Cambridge University Press). Steve died in November, 2003. See Barry Wellman's “Steve Berkowitz: A Network Pioneer has passed away,” in Connections 25(2), 2003. It has not been possible to add the updating of references or of the quality of graphics that might have been possible if Berkowitz were alive. An early version of the article appeared in the Proceedings of the Session on Combating Terrorist Networks: Current Research in Social Network Analysis for the New War Fighting Environment. 8th International Command and Control Research and Technology Symposium. National Defense University, Washington, DC June 17-19, 2003
  • SSH Tunneling through web filters | s-anand.net – Step by step tutorial on using Putty and an EC2 instance to set up a private web proxy on demand.
  • PyDroid GUI automation toolkit – GitHub – What is Pydroid?

    Pydroid is a simple toolkit for automating and scripting repetitive tasks, especially those involving a GUI, with Python. It includes functions for controlling the mouse and keyboard, finding colors and bitmaps on-screen, as well as displaying cross-platform alerts.
    Why use Pydroid?

    * Testing a GUI application for bugs and edge cases
    o You might think your app is stable, but what happens if you press that button 5000 times?
    * Automating games
    o Writing a script to beat that crappy flash game can be so much more gratifying than spending hours playing it yourself.
    * Freaking out friends and family
    o Well maybe this isn't really a practical use, but…

  • Time Series Data Library – More data sets – "This is a collection of about 800 time series drawn from many different fields.Agriculture Chemistry Crime Demography Ecology Finance Health Hydrology Industry Labour Market Macro-Economics Meteorology Micro-Economics Miscellaneous Physics Production Sales Simulated series Sport Transport & Tourism Tree-rings Utilities"
  • How informative is Twitter? » SemanticHacker Blog – "We undertook a small study to characterize the different types of messages that can be found on Twitter. We downloaded a sample of tweets over a two-week period using the Twitter streaming API. This resulted in a corpus of 8.9 million messages (”tweets”) posted by 2.6 million unique users. About 2.7 million of these tweets, or 31%, were replies to a tweet posted by another user, while half a million (6%) were retweets. Almost 2 million (22%) of the messages contained a URL."
  • Gremlin – a Turing-complete, graph-based programming language – GitHub – Gremlin is a Turing-complete, graph-based programming language developed in Java 1.6+ for key/value-pair multi-relational graphs known as property graphs. Gremlin makes extensive use of the XPath 1.0 language to support complex graph traversals. This language has applications in the areas of graph query, analysis, and manipulation. Connectors exist for the following data management systems:

    * TinkerGraph in-memory graph
    * Neo4j graph database
    * Sesame 2.0 compliant RDF stores
    * MongoDB document database

    The documentation for Gremlin can be found at this location. Finally, please visit TinkerPop for other software products.

  • The C Programming Language: 4.10 – by Kernighan & Ritchie & Lovecraft – void Rlyeh
    (int mene[], int wgah, int nagl) {
    int Ia, fhtagn;
    if (wgah>=nagl) return;
    swap (mene,wgah,(wgah+nagl)/2);
    fhtagn = wgah;
    for (Ia=wgah+1; Ia<=nagl; Ia++)
    if (mene[Ia]<mene[wgah])
    swap (mene,++fhtagn,Ia);
    swap (mene,wgah,fhtagn);
    Rlyeh (mene,wgah,fhtagn-1);
    Rlyeh (mene,fhtagn+1,nagl);

    } // PH'NGLUI MGLW'NAFH CTHULHU!

  • How to convert email addresses into name, age, ethnicity, sexual orientation – This is so Meta – "Save your email list as a CSV file (just comma separate those email addresses). Upload this file to your facebook account as if you wanted to add them as friends. Voila, facebook will give you all the profiles of all those users (in my test, about 80% of my email lists have facebook profiles). Now, click through each profile, and because of the new default facebook settings, which makes all information public, about 95% of the user info is available for you to harvest."
  • Microsoft Security Development Lifecycle (SDL): Tools Repository – A collection of previously internal-only security tools from Microsoft, including anti-xss, fuzz test, fxcop, threat modeling, binscope, now available for free download.
  • Analytics X Prize – Home – Forecast the murder rate in Philadelphia – The Analytics X Prize is an ongoing contest to apply analytics, modeling, and statistics to solve the social problems that affect our cities. It combines the fields of statistics, mathematics, and social science to understand the root causes of dysfunction in our neighborhoods. Understanding these relationships and discovering the most highly correlated variables allows us to deploy our limited resources more effectively and target the variables that will have the greatest positive impact on improvement.
  • PeteSearch: How to find user information from an email address – FindByEmail code released as open-source. You pass it an email address, and it queries 11 different public APIs to discover what information those services have on the user with that email address.
  • Measuring Measures: Beyond PageRank: Learning with Content and Networks – Conclusion: learning based on content and network data is the current state of the art There is a great paper and talk about personalization in Google News they use content for this purpose, and then user click streams to provide personalization, ie recommend specific articles within each topical cluster. The issue is content filtering is typically (as we say in research) "way harder." Suppose you have a social graph, a bunch of documents, and you know that some users in the social graph like some documents, and you want to recommend other documents that you think they will like. Using approaches based on Networks, you might consider clustering users based on co-visitaion (they have co-liked some of the documents). This scales great, and it internationalizes great. If you start extracting features from the documents themselves, then what you build for English may not work as well for the Chinese market. In addition, there is far more data in the text than there is in the social graph
  • mikemaccana's python-docx at master – GitHub – MIT-licensed Python library to read/write Microsoft Word docx format files. "The docx module reads and writes Microsoft Office Word 2007 docx files. These are referred to as 'WordML', 'Office Open XML' and 'Open XML' by Microsoft. They can be opened in Microsoft Office 2007, Microsoft Mac Office 2008, OpenOffice.org 2.2, and Apple iWork 08. The module was created when I was looking for a Python support for MS Word .doc files, but could only find various hacks involving COM automation, calling .net or Java, or automating OpenOffice or MS Office."

Bookmarks for December 31st through January 17th

These are my links for December 31st through January 17th:

  • Khan Academy – The Khan Academy is a not-for-profit organization with the mission of providing a high quality education to anyone, anywhere.

    We have 1000+ videos on YouTube covering everything from basic arithmetic and algebra to differential equations, physics, chemistry, biology and finance which have been recorded by Salman Khan.

  • StarCraft AI Competition | Expressive Intelligence Studio – AI bot warfare competition using a hacked API to run StarCraft, will be held at AIIDE2010 in October 2010.
    The competition will use StarCraft Brood War 1.16.1. Bots for StarCraft can be developed using the Broodwar API, which provides hooks into StarCraft and enables the development of custom AI for StarCraft. A C++ interface enables developers to query the current state of the game and issue orders to units. An introduction to the Broodwar API is available here. Instructions for building a bot that communicates with a remote process are available here. There is also a Forum. We encourage submission of bots that make use of advanced AI techniques. Some ideas are:
    * Planning
    * Data Mining
    * Machine Learning
    * Case-Based Reasoning
  • Measuring Measures: Learning About Statistical Learning – A "quick start guide" for statistical and machine learning systems, good collection of references.
  • Berkowitz et al : The use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems (2006) – Berkowitz, Steven D., Woodward, Lloyd H., & Woodward, Caitlin. (2006). Use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems. Originally intended for publication in updating the 1988 volume, eds., Wellman and Berkowitz, Social Structures: A Network Approach (Cambridge University Press). Steve died in November, 2003. See Barry Wellman's “Steve Berkowitz: A Network Pioneer has passed away,” in Connections 25(2), 2003. It has not been possible to add the updating of references or of the quality of graphics that might have been possible if Berkowitz were alive. An early version of the article appeared in the Proceedings of the Session on Combating Terrorist Networks: Current Research in Social Network Analysis for the New War Fighting Environment. 8th International Command and Control Research and Technology Symposium. National Defense University, Washington, DC June 17-19, 2003
  • SSH Tunneling through web filters | s-anand.net – Step by step tutorial on using Putty and an EC2 instance to set up a private web proxy on demand.
  • PyDroid GUI automation toolkit – GitHub – What is Pydroid?

    Pydroid is a simple toolkit for automating and scripting repetitive tasks, especially those involving a GUI, with Python. It includes functions for controlling the mouse and keyboard, finding colors and bitmaps on-screen, as well as displaying cross-platform alerts.
    Why use Pydroid?

    * Testing a GUI application for bugs and edge cases
    o You might think your app is stable, but what happens if you press that button 5000 times?
    * Automating games
    o Writing a script to beat that crappy flash game can be so much more gratifying than spending hours playing it yourself.
    * Freaking out friends and family
    o Well maybe this isn't really a practical use, but…

  • Time Series Data Library – More data sets – "This is a collection of about 800 time series drawn from many different fields.Agriculture Chemistry Crime Demography Ecology Finance Health Hydrology Industry Labour Market Macro-Economics Meteorology Micro-Economics Miscellaneous Physics Production Sales Simulated series Sport Transport & Tourism Tree-rings Utilities"
  • How informative is Twitter? » SemanticHacker Blog – "We undertook a small study to characterize the different types of messages that can be found on Twitter. We downloaded a sample of tweets over a two-week period using the Twitter streaming API. This resulted in a corpus of 8.9 million messages (”tweets”) posted by 2.6 million unique users. About 2.7 million of these tweets, or 31%, were replies to a tweet posted by another user, while half a million (6%) were retweets. Almost 2 million (22%) of the messages contained a URL."
  • Gremlin – a Turing-complete, graph-based programming language – GitHub – Gremlin is a Turing-complete, graph-based programming language developed in Java 1.6+ for key/value-pair multi-relational graphs known as property graphs. Gremlin makes extensive use of the XPath 1.0 language to support complex graph traversals. This language has applications in the areas of graph query, analysis, and manipulation. Connectors exist for the following data management systems:

    * TinkerGraph in-memory graph
    * Neo4j graph database
    * Sesame 2.0 compliant RDF stores
    * MongoDB document database

    The documentation for Gremlin can be found at this location. Finally, please visit TinkerPop for other software products.

  • The C Programming Language: 4.10 – by Kernighan & Ritchie & Lovecraft – void Rlyeh
    (int mene[], int wgah, int nagl) {
    int Ia, fhtagn;
    if (wgah>=nagl) return;
    swap (mene,wgah,(wgah+nagl)/2);
    fhtagn = wgah;
    for (Ia=wgah+1; Ia<=nagl; Ia++)
    if (mene[Ia]<mene[wgah])
    swap (mene,++fhtagn,Ia);
    swap (mene,wgah,fhtagn);
    Rlyeh (mene,wgah,fhtagn-1);
    Rlyeh (mene,fhtagn+1,nagl);

    } // PH'NGLUI MGLW'NAFH CTHULHU!

  • How to convert email addresses into name, age, ethnicity, sexual orientation – This is so Meta – "Save your email list as a CSV file (just comma separate those email addresses). Upload this file to your facebook account as if you wanted to add them as friends. Voila, facebook will give you all the profiles of all those users (in my test, about 80% of my email lists have facebook profiles). Now, click through each profile, and because of the new default facebook settings, which makes all information public, about 95% of the user info is available for you to harvest."
  • Microsoft Security Development Lifecycle (SDL): Tools Repository – A collection of previously internal-only security tools from Microsoft, including anti-xss, fuzz test, fxcop, threat modeling, binscope, now available for free download.
  • Analytics X Prize – Home – Forecast the murder rate in Philadelphia – The Analytics X Prize is an ongoing contest to apply analytics, modeling, and statistics to solve the social problems that affect our cities. It combines the fields of statistics, mathematics, and social science to understand the root causes of dysfunction in our neighborhoods. Understanding these relationships and discovering the most highly correlated variables allows us to deploy our limited resources more effectively and target the variables that will have the greatest positive impact on improvement.
  • PeteSearch: How to find user information from an email address – FindByEmail code released as open-source. You pass it an email address, and it queries 11 different public APIs to discover what information those services have on the user with that email address.
  • Measuring Measures: Beyond PageRank: Learning with Content and Networks – Conclusion: learning based on content and network data is the current state of the art There is a great paper and talk about personalization in Google News they use content for this purpose, and then user click streams to provide personalization, ie recommend specific articles within each topical cluster. The issue is content filtering is typically (as we say in research) "way harder." Suppose you have a social graph, a bunch of documents, and you know that some users in the social graph like some documents, and you want to recommend other documents that you think they will like. Using approaches based on Networks, you might consider clustering users based on co-visitaion (they have co-liked some of the documents). This scales great, and it internationalizes great. If you start extracting features from the documents themselves, then what you build for English may not work as well for the Chinese market. In addition, there is far more data in the text than there is in the social graph
  • mikemaccana's python-docx at master – GitHub – MIT-licensed Python library to read/write Microsoft Word docx format files. "The docx module reads and writes Microsoft Office Word 2007 docx files. These are referred to as 'WordML', 'Office Open XML' and 'Open XML' by Microsoft. They can be opened in Microsoft Office 2007, Microsoft Mac Office 2008, OpenOffice.org 2.2, and Apple iWork 08. The module was created when I was looking for a Python support for MS Word .doc files, but could only find various hacks involving COM automation, calling .net or Java, or automating OpenOffice or MS Office."

Bookmarks for December 31st through January 17th

These are my links for December 31st through January 17th:

  • Khan Academy – The Khan Academy is a not-for-profit organization with the mission of providing a high quality education to anyone, anywhere.

    We have 1000+ videos on YouTube covering everything from basic arithmetic and algebra to differential equations, physics, chemistry, biology and finance which have been recorded by Salman Khan.

  • StarCraft AI Competition | Expressive Intelligence Studio – AI bot warfare competition using a hacked API to run StarCraft, will be held at AIIDE2010 in October 2010.
    The competition will use StarCraft Brood War 1.16.1. Bots for StarCraft can be developed using the Broodwar API, which provides hooks into StarCraft and enables the development of custom AI for StarCraft. A C++ interface enables developers to query the current state of the game and issue orders to units. An introduction to the Broodwar API is available here. Instructions for building a bot that communicates with a remote process are available here. There is also a Forum. We encourage submission of bots that make use of advanced AI techniques. Some ideas are:
    * Planning
    * Data Mining
    * Machine Learning
    * Case-Based Reasoning
  • Measuring Measures: Learning About Statistical Learning – A "quick start guide" for statistical and machine learning systems, good collection of references.
  • Berkowitz et al : The use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems (2006) – Berkowitz, Steven D., Woodward, Lloyd H., & Woodward, Caitlin. (2006). Use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems. Originally intended for publication in updating the 1988 volume, eds., Wellman and Berkowitz, Social Structures: A Network Approach (Cambridge University Press). Steve died in November, 2003. See Barry Wellman's “Steve Berkowitz: A Network Pioneer has passed away,” in Connections 25(2), 2003. It has not been possible to add the updating of references or of the quality of graphics that might have been possible if Berkowitz were alive. An early version of the article appeared in the Proceedings of the Session on Combating Terrorist Networks: Current Research in Social Network Analysis for the New War Fighting Environment. 8th International Command and Control Research and Technology Symposium. National Defense University, Washington, DC June 17-19, 2003
  • SSH Tunneling through web filters | s-anand.net – Step by step tutorial on using Putty and an EC2 instance to set up a private web proxy on demand.
  • PyDroid GUI automation toolkit – GitHub – What is Pydroid?

    Pydroid is a simple toolkit for automating and scripting repetitive tasks, especially those involving a GUI, with Python. It includes functions for controlling the mouse and keyboard, finding colors and bitmaps on-screen, as well as displaying cross-platform alerts.
    Why use Pydroid?

    * Testing a GUI application for bugs and edge cases
    o You might think your app is stable, but what happens if you press that button 5000 times?
    * Automating games
    o Writing a script to beat that crappy flash game can be so much more gratifying than spending hours playing it yourself.
    * Freaking out friends and family
    o Well maybe this isn't really a practical use, but…

  • Time Series Data Library – More data sets – "This is a collection of about 800 time series drawn from many different fields.Agriculture Chemistry Crime Demography Ecology Finance Health Hydrology Industry Labour Market Macro-Economics Meteorology Micro-Economics Miscellaneous Physics Production Sales Simulated series Sport Transport & Tourism Tree-rings Utilities"
  • How informative is Twitter? » SemanticHacker Blog – "We undertook a small study to characterize the different types of messages that can be found on Twitter. We downloaded a sample of tweets over a two-week period using the Twitter streaming API. This resulted in a corpus of 8.9 million messages (”tweets”) posted by 2.6 million unique users. About 2.7 million of these tweets, or 31%, were replies to a tweet posted by another user, while half a million (6%) were retweets. Almost 2 million (22%) of the messages contained a URL."
  • Gremlin – a Turing-complete, graph-based programming language – GitHub – Gremlin is a Turing-complete, graph-based programming language developed in Java 1.6+ for key/value-pair multi-relational graphs known as property graphs. Gremlin makes extensive use of the XPath 1.0 language to support complex graph traversals. This language has applications in the areas of graph query, analysis, and manipulation. Connectors exist for the following data management systems:

    * TinkerGraph in-memory graph
    * Neo4j graph database
    * Sesame 2.0 compliant RDF stores
    * MongoDB document database

    The documentation for Gremlin can be found at this location. Finally, please visit TinkerPop for other software products.

  • The C Programming Language: 4.10 – by Kernighan & Ritchie & Lovecraft – void Rlyeh
    (int mene[], int wgah, int nagl) {
    int Ia, fhtagn;
    if (wgah>=nagl) return;
    swap (mene,wgah,(wgah+nagl)/2);
    fhtagn = wgah;
    for (Ia=wgah+1; Ia<=nagl; Ia++)
    if (mene[Ia]<mene[wgah])
    swap (mene,++fhtagn,Ia);
    swap (mene,wgah,fhtagn);
    Rlyeh (mene,wgah,fhtagn-1);
    Rlyeh (mene,fhtagn+1,nagl);

    } // PH'NGLUI MGLW'NAFH CTHULHU!

  • How to convert email addresses into name, age, ethnicity, sexual orientation – This is so Meta – "Save your email list as a CSV file (just comma separate those email addresses). Upload this file to your facebook account as if you wanted to add them as friends. Voila, facebook will give you all the profiles of all those users (in my test, about 80% of my email lists have facebook profiles). Now, click through each profile, and because of the new default facebook settings, which makes all information public, about 95% of the user info is available for you to harvest."
  • Microsoft Security Development Lifecycle (SDL): Tools Repository – A collection of previously internal-only security tools from Microsoft, including anti-xss, fuzz test, fxcop, threat modeling, binscope, now available for free download.
  • Analytics X Prize – Home – Forecast the murder rate in Philadelphia – The Analytics X Prize is an ongoing contest to apply analytics, modeling, and statistics to solve the social problems that affect our cities. It combines the fields of statistics, mathematics, and social science to understand the root causes of dysfunction in our neighborhoods. Understanding these relationships and discovering the most highly correlated variables allows us to deploy our limited resources more effectively and target the variables that will have the greatest positive impact on improvement.
  • PeteSearch: How to find user information from an email address – FindByEmail code released as open-source. You pass it an email address, and it queries 11 different public APIs to discover what information those services have on the user with that email address.
  • Measuring Measures: Beyond PageRank: Learning with Content and Networks – Conclusion: learning based on content and network data is the current state of the art There is a great paper and talk about personalization in Google News they use content for this purpose, and then user click streams to provide personalization, ie recommend specific articles within each topical cluster. The issue is content filtering is typically (as we say in research) "way harder." Suppose you have a social graph, a bunch of documents, and you know that some users in the social graph like some documents, and you want to recommend other documents that you think they will like. Using approaches based on Networks, you might consider clustering users based on co-visitaion (they have co-liked some of the documents). This scales great, and it internationalizes great. If you start extracting features from the documents themselves, then what you build for English may not work as well for the Chinese market. In addition, there is far more data in the text than there is in the social graph
  • mikemaccana's python-docx at master – GitHub – MIT-licensed Python library to read/write Microsoft Word docx format files. "The docx module reads and writes Microsoft Office Word 2007 docx files. These are referred to as 'WordML', 'Office Open XML' and 'Open XML' by Microsoft. They can be opened in Microsoft Office 2007, Microsoft Mac Office 2008, OpenOffice.org 2.2, and Apple iWork 08. The module was created when I was looking for a Python support for MS Word .doc files, but could only find various hacks involving COM automation, calling .net or Java, or automating OpenOffice or MS Office."

Bookmarks for June 13th through January 16th

These are my links for June 13th through January 16th:

  • StarCraft AI Competition | Expressive Intelligence Studio – AI bot warfare competition using a hacked API to run StarCraft, will be held at AIIDE2010 in October 2010.
    The competition will use StarCraft Brood War 1.16.1. Bots for StarCraft can be developed using the Broodwar API, which provides hooks into StarCraft and enables the development of custom AI for StarCraft. A C++ interface enables developers to query the current state of the game and issue orders to units. An introduction to the Broodwar API is available here. Instructions for building a bot that communicates with a remote process are available here. There is also a Forum. We encourage submission of bots that make use of advanced AI techniques. Some ideas are:
    * Planning
    * Data Mining
    * Machine Learning
    * Case-Based Reasoning
  • Measuring Measures: Learning About Statistical Learning – A "quick start guide" for statistical and machine learning systems, good collection of references.
  • Berkowitz et al : The use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems (2006) – Berkowitz, Steven D., Woodward, Lloyd H., & Woodward, Caitlin. (2006). Use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems. Originally intended for publication in updating the 1988 volume, eds., Wellman and Berkowitz, Social Structures: A Network Approach (Cambridge University Press). Steve died in November, 2003. See Barry Wellman's “Steve Berkowitz: A Network Pioneer has passed away,” in Connections 25(2), 2003. It has not been possible to add the updating of references or of the quality of graphics that might have been possible if Berkowitz were alive. An early version of the article appeared in the Proceedings of the Session on Combating Terrorist Networks: Current Research in Social Network Analysis for the New War Fighting Environment. 8th International Command and Control Research and Technology Symposium. National Defense University, Washington, DC June 17-19, 2003
  • SSH Tunneling through web filters | s-anand.net – Step by step tutorial on using Putty and an EC2 instance to set up a private web proxy on demand.
  • PyDroid GUI automation toolkit – GitHub – What is Pydroid?

    Pydroid is a simple toolkit for automating and scripting repetitive tasks, especially those involving a GUI, with Python. It includes functions for controlling the mouse and keyboard, finding colors and bitmaps on-screen, as well as displaying cross-platform alerts.
    Why use Pydroid?

    * Testing a GUI application for bugs and edge cases
    o You might think your app is stable, but what happens if you press that button 5000 times?
    * Automating games
    o Writing a script to beat that crappy flash game can be so much more gratifying than spending hours playing it yourself.
    * Freaking out friends and family
    o Well maybe this isn't really a practical use, but…

  • Time Series Data Library – More data sets – "This is a collection of about 800 time series drawn from many different fields.Agriculture Chemistry Crime Demography Ecology Finance Health Hydrology Industry Labour Market Macro-Economics Meteorology Micro-Economics Miscellaneous Physics Production Sales Simulated series Sport Transport & Tourism Tree-rings Utilities"
  • How informative is Twitter? » SemanticHacker Blog – "We undertook a small study to characterize the different types of messages that can be found on Twitter. We downloaded a sample of tweets over a two-week period using the Twitter streaming API. This resulted in a corpus of 8.9 million messages (”tweets”) posted by 2.6 million unique users. About 2.7 million of these tweets, or 31%, were replies to a tweet posted by another user, while half a million (6%) were retweets. Almost 2 million (22%) of the messages contained a URL."
  • Gremlin – a Turing-complete, graph-based programming language – GitHub – Gremlin is a Turing-complete, graph-based programming language developed in Java 1.6+ for key/value-pair multi-relational graphs known as property graphs. Gremlin makes extensive use of the XPath 1.0 language to support complex graph traversals. This language has applications in the areas of graph query, analysis, and manipulation. Connectors exist for the following data management systems:

    * TinkerGraph in-memory graph
    * Neo4j graph database
    * Sesame 2.0 compliant RDF stores
    * MongoDB document database

    The documentation for Gremlin can be found at this location. Finally, please visit TinkerPop for other software products.

  • The C Programming Language: 4.10 – by Kernighan & Ritchie & Lovecraft – void Rlyeh
    (int mene[], int wgah, int nagl) {
    int Ia, fhtagn;
    if (wgah>=nagl) return;
    swap (mene,wgah,(wgah+nagl)/2);
    fhtagn = wgah;
    for (Ia=wgah+1; Ia<=nagl; Ia++)
    if (mene[Ia]<mene[wgah])
    swap (mene,++fhtagn,Ia);
    swap (mene,wgah,fhtagn);
    Rlyeh (mene,wgah,fhtagn-1);
    Rlyeh (mene,fhtagn+1,nagl);

    } // PH'NGLUI MGLW'NAFH CTHULHU!

  • How to convert email addresses into name, age, ethnicity, sexual orientation – This is so Meta – "Save your email list as a CSV file (just comma separate those email addresses). Upload this file to your facebook account as if you wanted to add them as friends. Voila, facebook will give you all the profiles of all those users (in my test, about 80% of my email lists have facebook profiles). Now, click through each profile, and because of the new default facebook settings, which makes all information public, about 95% of the user info is available for you to harvest."
  • Microsoft Security Development Lifecycle (SDL): Tools Repository – A collection of previously internal-only security tools from Microsoft, including anti-xss, fuzz test, fxcop, threat modeling, binscope, now available for free download.
  • Analytics X Prize – Home – Forecast the murder rate in Philadelphia – The Analytics X Prize is an ongoing contest to apply analytics, modeling, and statistics to solve the social problems that affect our cities. It combines the fields of statistics, mathematics, and social science to understand the root causes of dysfunction in our neighborhoods. Understanding these relationships and discovering the most highly correlated variables allows us to deploy our limited resources more effectively and target the variables that will have the greatest positive impact on improvement.
  • PeteSearch: How to find user information from an email address – FindByEmail code released as open-source. You pass it an email address, and it queries 11 different public APIs to discover what information those services have on the user with that email address.
  • Measuring Measures: Beyond PageRank: Learning with Content and Networks – Conclusion: learning based on content and network data is the current state of the art There is a great paper and talk about personalization in Google News they use content for this purpose, and then user click streams to provide personalization, ie recommend specific articles within each topical cluster. The issue is content filtering is typically (as we say in research) "way harder." Suppose you have a social graph, a bunch of documents, and you know that some users in the social graph like some documents, and you want to recommend other documents that you think they will like. Using approaches based on Networks, you might consider clustering users based on co-visitaion (they have co-liked some of the documents). This scales great, and it internationalizes great. If you start extracting features from the documents themselves, then what you build for English may not work as well for the Chinese market. In addition, there is far more data in the text than there is in the social graph
  • mikemaccana's python-docx at master – GitHub – MIT-licensed Python library to read/write Microsoft Word docx format files. "The docx module reads and writes Microsoft Office Word 2007 docx files. These are referred to as 'WordML', 'Office Open XML' and 'Open XML' by Microsoft. They can be opened in Microsoft Office 2007, Microsoft Mac Office 2008, OpenOffice.org 2.2, and Apple iWork 08. The module was created when I was looking for a Python support for MS Word .doc files, but could only find various hacks involving COM automation, calling .net or Java, or automating OpenOffice or MS Office."
  • Handy one-liners for SED – Sed expressions are powerful, but somewhat obscure and easy to screw up. A handy cheat sheet for common tasks.

Slide của tôi từ các Search Bảng điều chỉnh thời gian thực tại SES Chicago tuần trước

Although real time search is fairly new, as we end 2009, the ability to index and search fresh results is rapidly becoming a commodity, with Bing, various startups, and now Google all integrating status feeds from social networking services. The next set of challenges in 2010 will be around providing better relevance, information discovery, and topic exploration for social search, using signals from the dynamic behavior of users and their interaction with the social and topic graphs.

I gave a short talk on real time and social search for a panel at SES Chicago last week. I've been heads down for the past few months working on Bing Twitter Search, so now that the first launch is out the door it was a nice chance to talk with people about some of the work we're doing. There was a lot of interest in the sentiment, trend, and social graph analysis slides (9 and 10). I will write about those in a separate post, but wanted to get the presentation up for those who have been asking about it.

What's Different about Real Time and Social Search – HJL Slides For SES Chicago Dec 09

View more presentations from Ho John Lee .

What's Different about Real Time and Social Search – HJL Slides For SES Chicago Dec 09 – Presentation Transcript

  1. What's different about real time and social search?
    Ho John Lee
    Principal Program Manager
    Bing Social Search
    Search Engine Strategies
    Chicago – December 7, 2009
  2. What's Real Time Search Good For, Anyway?
  3. Twitter là Great cho thiếu thông tin Xem hoảng loạn Unfold Sống
    ... Hoặc tìm kiếm bóng bay
    http://xkcd.com/574/
  4. Some characteristics of Twitter / Social media
    Immediacy, Sentiment, Brevity
    Not always accurate
    Feelings, reactions, impressions
    Context is often essential to determine meaning
    Gestural – @user, #hashtag, RT, favorites, follows
    Self-organizing communities of attention and authority
    Content follows attention
    People talk about what others are talking about
    Observations and commentary from everywhere
    If there's no content, you can ask for some
    Extreme head and tail coverage
    Low relevance “noise” can become “signal” in aggregate
  5. Your product or brand could suddenly be at the center of a huge conversation
    Tiger Woods
    Balloon Boy
    Breaking Story
    Persistent Story
    Big Story
    Bigger Story
  6. Some characteristics of Real time / Social Search
    • Real time and social search is qualitatively different from traditional web search
    • Differences in ranking, relevance, use model
    • Social graph, user behavior, location, event correlation and other input signals
    • Real time search is frequently about discovery, not search per se
    • “what is everyone talking about”, followed by “what are people saying about ”
    • Top real time and social search results will usually differ from top web search results
  7. Bing Twitter Search at a glance
    Top Tweets
    Top Shared Links
    Tweets/Sentiment per link
    Adult /Spam filter; Tweets/Links ranking & relevance
  8. Bing Fall 2009: Twitter vertical, News, MSN, Maps
    MSN Local Edition
    Page 2: Tweets or Links
    Page 1: Tweets & Links
    Twitter Answer on News SERP
    MSN Hot Topics
  9. Topic / sentiment range, volume, trend analysis
    What is the baseline rate of mentions / sentiment per unit time?
    Changes in attention flow around a subject, location, topic
    Watch for correlated signals from multiple sources
    Consider source relevance and authority as well
  10. Graph analysis for relevance and ranking
    Spam marketing campaign
    Naturally connected community
    Spammy communities are highly visible – don't be part of one!
  11. Bing Twitter Maps Demo
  12. To rise above the noise, there is more to do as search gets more social
    Plus ...
  13. Cam On
    Ho John Lee
    hojohn . lee @ microsoft.com
    twitter.com/hjl
The session was moderated by Barbara Coll , CEO, WebMama.com Inc., with panelists Bill Fischer , Co-Founder & Director, Workdigital, Ltd., Rob Walk , Managing Partner, NovaRising, Nathan Stoll , Co-Founder, Aardvark, and Ho John Lee , Principal Program Manager, Social and Real Time Search, Microsoft Bing.

Slide của tôi từ các Search Bảng điều chỉnh thời gian thực tại SES Chicago tuần trước

Although real time search is fairly new, as we end 2009, the ability to index and search fresh results is rapidly becoming a commodity, with Bing, various startups, and now Google all integrating status feeds from social networking services. The next set of challenges in 2010 will be around providing better relevance, information discovery, and topic exploration for social search, using signals from the dynamic behavior of users and their interaction with the social and topic graphs.

I gave a short talk on real time and social search for a panel at SES Chicago last week. I've been heads down for the past few months working on Bing Twitter Search, so now that the first launch is out the door it was a nice chance to talk with people about some of the work we're doing. There was a lot of interest in the sentiment, trend, and social graph analysis slides (9 and 10). I will write about those in a separate post, but wanted to get the presentation up for those who have been asking about it.

What's Different about Real Time and Social Search – HJL Slides For SES Chicago Dec 09

View more presentations from Ho John Lee .

What's Different about Real Time and Social Search – HJL Slides For SES Chicago Dec 09 – Presentation Transcript

  1. What's different about real time and social search?
    Ho John Lee
    Principal Program Manager
    Bing Social Search
    Search Engine Strategies
    Chicago – December 7, 2009
  2. What's Real Time Search Good For, Anyway?
  3. Twitter is Great for Watching Uninformed Panics Unfold Live
    …or finding balloons
    http://xkcd.com/574/
  4. Some characteristics of Twitter / Social media
    Immediacy, Sentiment, Brevity
    Not always accurate
    Feelings, reactions, impressions
    Context is often essential to determine meaning
    Gestural – @user, #hashtag, RT, favorites, follows
    Self-organizing communities of attention and authority
    Content follows attention
    People talk about what others are talking about
    Observations and commentary from everywhere
    If there's no content, you can ask for some
    Extreme head and tail coverage
    Low relevance “noise” can become “signal” in aggregate
  5. Your product or brand could suddenly be at the center of a huge conversation
    Tiger Woods
    Balloon Boy
    Breaking Story
    Persistent Story
    Big Story
    Bigger Story
  6. Some characteristics of Real time / Social Search
    • Real time and social search is qualitatively different from traditional web search
    • Differences in ranking, relevance, use model
    • Social graph, user behavior, location, event correlation and other input signals
    • Real time search is frequently about discovery, not search per se
    • “what is everyone talking about”, followed by “what are people saying about ”
    • Top real time and social search results will usually differ from top web search results
  7. Bing Twitter Search at a glance
    Top Tweets
    Top Shared Links
    Tweets/Sentiment per link
    Adult /Spam filter; Tweets/Links ranking & relevance
  8. Bing Fall 2009: Twitter vertical, News, MSN, Maps
    MSN Local Edition
    Page 2: Tweets or Links
    Page 1: Tweets & Links
    Twitter Answer on News SERP
    MSN Hot Topics
  9. Topic / sentiment range, volume, trend analysis
    What is the baseline rate of mentions / sentiment per unit time?
    Changes in attention flow around a subject, location, topic
    Watch for correlated signals from multiple sources
    Consider source relevance and authority as well
  10. Graph analysis for relevance and ranking
    Spam marketing campaign
    Naturally connected community
    Spammy communities are highly visible – don't be part of one!
  11. Bing Twitter Maps Demo
  12. To rise above the noise, there is more to do as search gets more social
    Plus ...
  13. Cam On
    Ho John Lee
    hojohn . lee @ microsoft.com
    twitter.com/hjl
The session was moderated by Barbara Coll , CEO, WebMama.com Inc., with panelists Bill Fischer , Co-Founder & Director, Workdigital, Ltd., Rob Walk , Managing Partner, NovaRising, Nathan Stoll , Co-Founder, Aardvark, and Ho John Lee , Principal Program Manager, Social and Real Time Search, Microsoft Bing.

Slide của tôi từ các Search Bảng điều chỉnh thời gian thực tại SES Chicago tuần trước

Although real time search is fairly new, as we end 2009, the ability to index and search fresh results is rapidly becoming a commodity, with Bing, various startups, and now Google all integrating status feeds from social networking services. The next set of challenges in 2010 will be around providing better relevance, information discovery, and topic exploration for social search, using signals from the dynamic behavior of users and their interaction with the social and topic graphs.

I gave a short talk on real time and social search for a panel at SES Chicago last week. I've been heads down for the past few months working on Bing Twitter Search, so now that the first launch is out the door it was a nice chance to talk with people about some of the work we're doing. There was a lot of interest in the sentiment, trend, and social graph analysis slides (9 and 10). I will write about those in a separate post, but wanted to get the presentation up for those who have been asking about it.

What's Different about Real Time and Social Search – HJL Slides For SES Chicago Dec 09

View more presentations from Ho John Lee .

What's Different about Real Time and Social Search – HJL Slides For SES Chicago Dec 09 – Presentation Transcript

  1. What's different about real time and social search?
    Ho John Lee
    Principal Program Manager
    Bing Social Search
    Search Engine Strategies
    Chicago – December 7, 2009
  2. What's Real Time Search Good For, Anyway?
  3. Twitter is Great for Watching Uninformed Panics Unfold Live
    …or finding balloons
    http://xkcd.com/574/
  4. Some characteristics of Twitter / Social media
    Immediacy, Sentiment, Brevity
    Not always accurate
    Feelings, reactions, impressions
    Context is often essential to determine meaning
    Gestural – @user, #hashtag, RT, favorites, follows
    Self-organizing communities of attention and authority
    Content follows attention
    People talk about what others are talking about
    Observations and commentary from everywhere
    If there's no content, you can ask for some
    Extreme head and tail coverage
    Low relevance “noise” can become “signal” in aggregate
  5. Your product or brand could suddenly be at the center of a huge conversation
    Tiger Woods
    Balloon Boy
    Breaking Story
    Persistent Story
    Big Story
    Bigger Story
  6. Some characteristics of Real time / Social Search
    • Real time and social search is qualitatively different from traditional web search
    • Differences in ranking, relevance, use model
    • Social graph, user behavior, location, event correlation and other input signals
    • Real time search is frequently about discovery, not search per se
    • “what is everyone talking about”, followed by “what are people saying about ”
    • Top real time and social search results will usually differ from top web search results
  7. Bing Twitter Search at a glance
    Top Tweets
    Top Shared Links
    Tweets/Sentiment per link
    Adult /Spam filter; Tweets/Links ranking & relevance
  8. Bing Fall 2009: Twitter vertical, News, MSN, Maps
    MSN Local Edition
    Page 2: Tweets or Links
    Page 1: Tweets & Links
    Twitter Answer on News SERP
    MSN Hot Topics
  9. Topic / sentiment range, volume, trend analysis
    What is the baseline rate of mentions / sentiment per unit time?
    Changes in attention flow around a subject, location, topic
    Watch for correlated signals from multiple sources
    Consider source relevance and authority as well
  10. Graph analysis for relevance and ranking
    Spam marketing campaign
    Naturally connected community
    Spammy communities are highly visible – don't be part of one!
  11. Bing Twitter Maps Demo
  12. To rise above the noise, there is more to do as search gets more social
    Plus ...
  13. Cam On
    Ho John Lee
    hojohn . lee @ microsoft.com
    twitter.com/hjl
The session was moderated by Barbara Coll , CEO, WebMama.com Inc., with panelists Bill Fischer , Co-Founder & Director, Workdigital, Ltd., Rob Walk , Managing Partner, NovaRising, Nathan Stoll , Co-Founder, Aardvark, and Ho John Lee , Principal Program Manager, Social and Real Time Search, Microsoft Bing.

Slide của tôi từ các Search Bảng điều chỉnh thời gian thực tại SES Chicago tuần trước

Although real time search is fairly new, as we end 2009, the ability to index and search fresh results is rapidly becoming a commodity, with Bing, various startups, and now Google all integrating status feeds from social networking services. The next set of challenges in 2010 will be around providing better relevance, information discovery, and topic exploration for social search, using signals from the dynamic behavior of users and their interaction with the social and topic graphs.

I gave a short talk on real time and social search for a panel at SES Chicago last week. I've been heads down for the past few months working on Bing Twitter Search, so now that the first launch is out the door it was a nice chance to talk with people about some of the work we're doing. There was a lot of interest in the sentiment, trend, and social graph analysis slides (9 and 10). I will write about those in a separate post, but wanted to get the presentation up for those who have been asking about it.

What's Different about Real Time and Social Search – HJL Slides For SES Chicago Dec 09

View more presentations from Ho John Lee .

What's Different about Real Time and Social Search – HJL Slides For SES Chicago Dec 09 – Presentation Transcript

  1. What's different about real time and social search?
    Ho John Lee
    Principal Program Manager
    Bing Social Search
    Search Engine Strategies
    Chicago – December 7, 2009
  2. What's Real Time Search Good For, Anyway?
  3. Twitter is Great for Watching Uninformed Panics Unfold Live
    …or finding balloons
    http://xkcd.com/574/
  4. Some characteristics of Twitter / Social media
    Immediacy, Sentiment, Brevity
    Not always accurate
    Feelings, reactions, impressions
    Context is often essential to determine meaning
    Gestural – @user, #hashtag, RT, favorites, follows
    Self-organizing communities of attention and authority
    Content follows attention
    People talk about what others are talking about
    Observations and commentary from everywhere
    If there's no content, you can ask for some
    Extreme head and tail coverage
    Low relevance “noise” can become “signal” in aggregate
  5. Your product or brand could suddenly be at the center of a huge conversation
    Tiger Woods
    Balloon Boy
    Breaking Story
    Persistent Story
    Big Story
    Bigger Story
  6. Some characteristics of Real time / Social Search
    • Real time and social search is qualitatively different from traditional web search
    • Differences in ranking, relevance, use model
    • Social graph, user behavior, location, event correlation and other input signals
    • Real time search is frequently about discovery, not search per se
    • “what is everyone talking about”, followed by “what are people saying about ”
    • Top real time and social search results will usually differ from top web search results
  7. Bing Twitter Search at a glance
    Top Tweets
    Top Shared Links
    Tweets/Sentiment per link
    Adult /Spam filter; Tweets/Links ranking & relevance
  8. Bing Fall 2009: Twitter vertical, News, MSN, Maps
    MSN Local Edition
    Page 2: Tweets or Links
    Page 1: Tweets & Links
    Twitter Answer on News SERP
    MSN Hot Topics
  9. Topic / sentiment range, volume, trend analysis
    What is the baseline rate of mentions / sentiment per unit time?
    Changes in attention flow around a subject, location, topic
    Watch for correlated signals from multiple sources
    Consider source relevance and authority as well
  10. Graph analysis for relevance and ranking
    Spam marketing campaign
    Naturally connected community
    Spammy communities are highly visible – don't be part of one!
  11. Bing Twitter Maps Demo
  12. To rise above the noise, there is more to do as search gets more social
    Plus ...
  13. Cam On
    Ho John Lee
    hojohn . lee @ microsoft.com
    twitter.com/hjl
The session was moderated by Barbara Coll , CEO, WebMama.com Inc., with panelists Bill Fischer , Co-Founder & Director, Workdigital, Ltd., Rob Walk , Managing Partner, NovaRising, Nathan Stoll , Co-Founder, Aardvark, and Ho John Lee , Principal Program Manager, Social and Real Time Search, Microsoft Bing.
Page 3 of 78 1 2 3 4 5 ... 10 20 30 ... Last »