Cảnh báo: Thông số 1 để ace_where () dự kiến sẽ là một tài liệu tham khảo, giá trị được đưa ra trong / home / hjlee / hjl / hojohnlee.com / weblog / wp-includes / plugin.php trên đường dây 227

Cảnh báo: Thông số 1 để ace_join () dự kiến sẽ là một tài liệu tham khảo, giá trị được đưa ra trong / home / hjlee / hjl / hojohnlee.com / weblog / wp-includes / plugin.php trên đường dây 227
Weblog ho John Lee

Bookmark cho 23 tháng 1 15:00-15:00

Đây là những liên kết của tôi cho 23 tháng 1 15:00-15:00:

  • Data.gov - Các bộ dữ liệu: Cơ quan Chỉ thị Chính phủ Mở - Bộ dữ liệu theo yêu cầu của Chỉ thị của Chính phủ thông qua việc mở cửa cuối ngày, ngày 22 tháng 1 năm 2010 Đạo luật Tự do Thông tin yêu cầu các bản ghi, Kho bạc TARP và các bản ghi hoạt động phái sinh, tội phạm, thu nhập, nông nghiệp. bộ dữ liệu.

Bookmark cho ngày 20 tháng 1 thông qua ngày 23 tháng 1

Đây là những liên kết của tôi cho tháng 20 thông qua ngày 23 tháng 1:

  • Data.gov - Các bộ dữ liệu: Cơ quan Chỉ thị Chính phủ Mở - Bộ dữ liệu theo yêu cầu của Chỉ thị của Chính phủ thông qua việc mở cửa cuối ngày, ngày 22 tháng 1 năm 2010 Đạo luật Tự do Thông tin yêu cầu các bản ghi, Kho bạc TARP và các bản ghi hoạt động phái sinh, tội phạm, thu nhập, nông nghiệp. bộ dữ liệu.
  • Tất cả các Twitter Bot của bạn cần là tình yêu - tên của bot? Jason Thorton. Anh ta đã ồn ào cùng trong nhiều tháng nay, việc đưa hơn 1.250 tweet của quý vị cho một số 174 người theo dõi. Tweet của mình, trong khi không đặc biệt sáng tạo, quản lý được cả hai đáng tin cậy và kịp thời. Và ông được hỗ trợ bởi một từ duy nhất: tình yêu.

    Thorton là sự sáng tạo của nhà phát triển Ryan Merket, những người xây dựng nó như một dự án bên trong khoảng ba giờ. Merket vừa đăng mã mà quyền hạn anh ta, và cũng đã tiết lộ làm thế nào anh đã Thorton có vẻ hơi thực tế: các bot tìm kiếm tweet của quý vị với từ "tình yêu" trong họ và tweets họ như là của riêng của nó.

  • Xây dựng một Bot Twitter -. "Gặp gỡ Jason Thorton Để những người biết Jason, ông là một doanh nhân thành công tại San Francisco, người tweets 4-5 lần một ngày Nhưng Jason có một bí mật, anh ấy không thực sự là một con người, ông là sản phẩm của tôi. thuật toán đơn giản trong PHP

    Jason tweets A LOT về từ "tình yêu" - đó là bởi vì Jason thực sự đánh cắp tweet của quý vị từ thời gian nào có chứa từ "tình yêu" và đăng tải chúng như là của riêng mình

    Jason cũng @ trả lời cho những người sử dụng từ "tình yêu" trong tweets của họ, và hỏi họ những câu hỏi ngẫu nhiên hoặc nói điều gì đó tùy ý

    Tôi mất khoảng 3 giờ để mã Jason, hãy tưởng tượng những gì một kỹ sư thực sự có thể làm với các thuật toán AI thực sự? Bây giờ nhận ra rằng nó đã là một thực tế. Các trang web như Twitter có đầy đủ các dự án phụ, các sáng kiến ​​công ty, và robot spam bots, cúm gia cầm. Khi dòng chảy tự do của thông tin trở nên cởi mở, số lượng tin sai tăng lên. Theres một nhu cầu thực sự đối với một bác sĩ thú y người chúng tôi gặp trên các trang web xã hội - sẽ được thú vị để xem làm thế nào thị trường này phát triển trong năm tới

  • Tình trạng giám sát trang web - API công trạng - màn hình sức khỏe cho 26 API từ các dịch vụ web phổ biến, bao gồm Google Search, Google Maps, Bing, Facebook, Twitter, Salesforce, YouTube, Amazon, eBay và những người khác
  • PG & E hệ thống điện Cúp Bản đồ - bản đồ này cho thấy sự mất hiện tại trong khu vực dịch vụ 70.000 dặm vuông của chúng tôi. Để xem thêm chi tiết về sự gián đoạn, trong đó có nguyên nhân và thời gian dự kiến ​​phục hồi, click vào biểu tượng mã màu kết hợp với cúp đó.

Bookmark cho ngày 20 tháng 1 thông qua ngày 22 tháng một

Đây là những liên kết của tôi cho ngày 20 tháng 1 đến tháng 22:

  • Tất cả các Twitter Bot của bạn cần là tình yêu - tên của bot? Jason Thorton. Anh ta đã ồn ào cùng trong nhiều tháng nay, việc đưa hơn 1.250 tweet của quý vị cho một số 174 người theo dõi. Tweet của mình, trong khi không đặc biệt sáng tạo, quản lý được cả hai đáng tin cậy và kịp thời. Và ông được hỗ trợ bởi một từ duy nhất: tình yêu.

    Thorton là sự sáng tạo của nhà phát triển Ryan Merket, những người xây dựng nó như một dự án bên trong khoảng ba giờ. Merket vừa đăng mã mà quyền hạn anh ta, và cũng đã tiết lộ làm thế nào anh đã Thorton có vẻ hơi thực tế: các bot tìm kiếm tweet của quý vị với từ "tình yêu" trong họ và tweets họ như là của riêng của nó.

  • Xây dựng một Bot Twitter -. "Gặp gỡ Jason Thorton Để những người biết Jason, ông là một doanh nhân thành công tại San Francisco, người tweets 4-5 lần một ngày Nhưng Jason có một bí mật, anh ấy không thực sự là một con người, ông là sản phẩm của tôi. thuật toán đơn giản trong PHP

    Jason tweets A LOT về từ "tình yêu" - đó là bởi vì Jason thực sự đánh cắp tweet của quý vị từ thời gian nào có chứa từ "tình yêu" và đăng tải chúng như là của riêng mình

    Jason cũng @ trả lời cho những người sử dụng từ "tình yêu" trong tweets của họ, và hỏi họ những câu hỏi ngẫu nhiên hoặc nói điều gì đó tùy ý

    Tôi mất khoảng 3 giờ để mã Jason, hãy tưởng tượng những gì một kỹ sư thực sự có thể làm với các thuật toán AI thực sự? Bây giờ nhận ra rằng nó đã là một thực tế. Các trang web như Twitter có đầy đủ các dự án phụ, các sáng kiến ​​công ty, và robot spam bots, cúm gia cầm. Khi dòng chảy tự do của thông tin trở nên cởi mở, số lượng tin sai tăng lên. Theres một nhu cầu thực sự đối với một bác sĩ thú y người chúng tôi gặp trên các trang web xã hội - sẽ được thú vị để xem làm thế nào thị trường này phát triển trong năm tới

  • Tình trạng giám sát trang web - API công trạng - màn hình sức khỏe cho 26 API từ các dịch vụ web phổ biến, bao gồm Google Search, Google Maps, Bing, Facebook, Twitter, Salesforce, YouTube, Amazon, eBay và những người khác
  • PG & E hệ thống điện Cúp Bản đồ - bản đồ này cho thấy sự mất hiện tại trong khu vực dịch vụ 70.000 dặm vuông của chúng tôi. Để xem thêm chi tiết về sự gián đoạn, trong đó có nguyên nhân và thời gian dự kiến ​​phục hồi, click vào biểu tượng mã màu kết hợp với cúp đó.

Bookmark cho ngày 20 tháng 1 10:26-14:12

Đây là những liên kết của tôi cho ngày 20 tháng 1 10:26-14:12:

  • Tình trạng giám sát trang web - API công trạng - màn hình sức khỏe cho 26 API từ các dịch vụ web phổ biến, bao gồm Google Search, Google Maps, Bing, Facebook, Twitter, Salesforce, YouTube, Amazon, eBay và những người khác
  • PG & E hệ thống điện Cúp Bản đồ - bản đồ này cho thấy sự mất hiện tại trong khu vực dịch vụ 70.000 dặm vuông của chúng tôi. Để xem thêm chi tiết về sự gián đoạn, trong đó có nguyên nhân và thời gian dự kiến ​​phục hồi, click vào biểu tượng mã màu kết hợp với cúp đó.

Bookmark cho ngày 20 tháng 1 10:26-10:26

Đây là những liên kết của tôi cho ngày 20 tháng 1 10:26-10:26:

  • PG & E hệ thống điện Cúp Bản đồ - bản đồ này cho thấy sự mất hiện tại trong khu vực dịch vụ 70.000 dặm vuông của chúng tôi. Để xem thêm chi tiết về sự gián đoạn, trong đó có nguyên nhân và thời gian dự kiến ​​phục hồi, click vào biểu tượng mã màu kết hợp với cúp đó.

Bookmark cho ngày 17 tháng 1 thông qua ngày 20 tháng 1

Đây là những liên kết của tôi cho ngày 17 tháng 1 đến tháng 20:

  • PG & E hệ thống điện Cúp Bản đồ - bản đồ này cho thấy sự mất hiện tại trong khu vực dịch vụ 70.000 dặm vuông của chúng tôi. Để xem thêm chi tiết về sự gián đoạn, trong đó có nguyên nhân và thời gian dự kiến ​​phục hồi, click vào biểu tượng mã màu kết hợp với cúp đó.
  • Twitter.com vs Twitter hệ sinh thái - Fred Wilson bình luận về một số dữ liệu từ John Borthwick cho thấy Twitter sử dụng hệ sinh thái = 3-5x Twitter.com trực tiếp.

    "Biểu đồ của John ước tính Twitter.com là khoảng 20mm UV một tháng tại Mỹ (comScore có nó ở 60mm UV trên toàn thế giới) và các hệ sinh thái Twitter vào khoảng 60mm UV ở Mỹ.

    Mà nói rằng trên tất cả các dịch vụ web, không chỉ AVC, hệ sinh thái Twitter là về 3x Twitter.com. Và trên blog này, mà khán giả chắc chắn là người sử dụng điện, tỷ lệ đó là 5x. "

  • Chris Walshaw :: Nghiên cứu :: Lưu trữ phân vùng - Chào mừng đến với Đại học Greenwich Biểu đồ phân vùng lưu trữ. Các kho lưu trữ bao gồm các phân vùng tốt nhất tìm thấy cho đến nay cho một loạt các biểu đồ và mục đích của nó là cung cấp một chuẩn mực, dựa vào đó các thuật toán phân vùng có thể được kiểm tra, và một nguồn tài nguyên để thử nghiệm.

    Các kho lưu trữ phân vùng đã hoạt động từ năm 2000 và bao gồm kết quả từ hầu hết các gói phần mềm phân vùng đồ thị lớn. Các nhà nghiên cứu phát triển các thuật toán phân vùng thử nghiệm thường xuyên trình phân vùng mới để đưa có thể.

    Hầu hết các đồ thị kiểm tra phát sinh từ các ứng dụng phân vùng điển hình, mặc dù các kho lưu trữ cũng bao gồm kết quả tính toán cho một bộ kiểm tra đồ thị màu [Wal04] chứa trong một phụ lục riêng biệt.

    Các kho lưu trữ ban đầu được thiết lập như là một phần của một dự án nghiên cứu phân vùng chất lượng rất cao và tác giả muốn đề cập đến các kho lưu trữ phân vùng nên trích dẫn bài báo [SWC04].

  • Thu thập thông tin «The Guy của Twitter sản phẩm - "Danh sách các sự cố ảnh hưởng đến thời gian tải trang của sản phẩm Twitter, phân biệt giữa tổng số thời gian chết, và một phần thời gian chết và thông tin bất khả tiếp cận, dựa trên các bài đăng công khai trên blog Twitter.

    http://status.twitter.com/archive

    Tôi đã làm hết sức mình để không tăng gấp đôi tính bất kỳ vấn đề, nhưng rất khó vì nhiều vấn đề xảy ra rất thường xuyên, và nó thường rất khó để phân biệt, từ những bài viết trên blog tình trạng một mình, giữa một vấn đề kiên trì được kinh nghiệm hoặc cố định, từ đó của một sự xuất hiện mới của một vấn đề tương tự hoặc giống nhau. Hơn nữa, tôi cũng loại trừ tác động trên Thời gian tải trang xuất phát từ kế hoạch bảo trì / thời gian chết - khoảng thời gian mà qua đó kỳ vọng người sử dụng sẽ được liên kết với hầu hết các lời hứa của sản phẩm của Thời gian tải trang. "

  • Soundboard.com - Soundboard.com là Danh mục của web lớn nhất của âm thanh miễn phí và soundboards - trong hơn 20 loại, cho điện thoại di động hoặc máy tính. 252.858 âm thanh miễn phí trên 17,171 soundboards từ phim đến thể thao, hiệu ứng âm thanh, truyền hình, người nổi tiếng, lịch sử và du lịch. Hoặc xây dựng, tùy chỉnh, địa chỉ mạng và quản lý của riêng bạn

Bookmark cho ngày 17 tháng 1 thông qua ngày 20 tháng 1

Đây là những liên kết của tôi cho ngày 17 tháng 1 đến tháng 20:

  • PG & E hệ thống điện Cúp Bản đồ - bản đồ này cho thấy sự mất hiện tại trong khu vực dịch vụ 70.000 dặm vuông của chúng tôi. Để xem thêm chi tiết về sự gián đoạn, trong đó có nguyên nhân và thời gian dự kiến ​​phục hồi, click vào biểu tượng mã màu kết hợp với cúp đó.
  • Twitter.com vs Twitter hệ sinh thái - Fred Wilson bình luận về một số dữ liệu từ John Borthwick cho thấy Twitter sử dụng hệ sinh thái = 3-5x Twitter.com trực tiếp.

    "Biểu đồ của John ước tính Twitter.com là khoảng 20mm UV một tháng tại Mỹ (comScore có nó ở 60mm UV trên toàn thế giới) và các hệ sinh thái Twitter vào khoảng 60mm UV ở Mỹ.

    Mà nói rằng trên tất cả các dịch vụ web, không chỉ AVC, hệ sinh thái Twitter là về 3x Twitter.com. Và trên blog này, mà khán giả chắc chắn là người sử dụng điện, tỷ lệ đó là 5x. "

  • Chris Walshaw :: Nghiên cứu :: Lưu trữ phân vùng - Chào mừng đến với Đại học Greenwich Biểu đồ phân vùng lưu trữ. Các kho lưu trữ bao gồm các phân vùng tốt nhất tìm thấy cho đến nay cho một loạt các biểu đồ và mục đích của nó là cung cấp một chuẩn mực, dựa vào đó các thuật toán phân vùng có thể được kiểm tra, và một nguồn tài nguyên để thử nghiệm.

    Các kho lưu trữ phân vùng đã hoạt động từ năm 2000 và bao gồm kết quả từ hầu hết các gói phần mềm phân vùng đồ thị lớn. Các nhà nghiên cứu phát triển các thuật toán phân vùng thử nghiệm thường xuyên trình phân vùng mới để đưa có thể.

    Hầu hết các đồ thị kiểm tra phát sinh từ các ứng dụng phân vùng điển hình, mặc dù các kho lưu trữ cũng bao gồm kết quả tính toán cho một bộ kiểm tra đồ thị màu [Wal04] chứa trong một phụ lục riêng biệt.

    Các kho lưu trữ ban đầu được thiết lập như là một phần của một dự án nghiên cứu phân vùng chất lượng rất cao và tác giả muốn đề cập đến các kho lưu trữ phân vùng nên trích dẫn bài báo [SWC04].

  • Thu thập thông tin «The Guy của Twitter sản phẩm - "Danh sách các sự cố ảnh hưởng đến thời gian tải trang của sản phẩm Twitter, phân biệt giữa tổng số thời gian chết, và một phần thời gian chết và thông tin bất khả tiếp cận, dựa trên các bài đăng công khai trên blog Twitter.

    http://status.twitter.com/archive

    Tôi đã làm hết sức mình để không tăng gấp đôi tính bất kỳ vấn đề, nhưng rất khó vì nhiều vấn đề xảy ra rất thường xuyên, và nó thường rất khó để phân biệt, từ những bài viết trên blog tình trạng một mình, giữa một vấn đề kiên trì được kinh nghiệm hoặc cố định, từ đó của một sự xuất hiện mới của một vấn đề tương tự hoặc giống nhau. Hơn nữa, tôi cũng loại trừ tác động trên Thời gian tải trang xuất phát từ kế hoạch bảo trì / thời gian chết - khoảng thời gian mà qua đó kỳ vọng người sử dụng sẽ được liên kết với hầu hết các lời hứa của sản phẩm của Thời gian tải trang. "

  • Soundboard.com - Soundboard.com là Danh mục của web lớn nhất của âm thanh miễn phí và soundboards - trong hơn 20 loại, cho điện thoại di động hoặc máy tính. 252.858 âm thanh miễn phí trên 17,171 soundboards từ phim đến thể thao, hiệu ứng âm thanh, truyền hình, người nổi tiếng, lịch sử và du lịch. Hoặc xây dựng, tùy chỉnh, địa chỉ mạng và quản lý của riêng bạn

Bookmark cho ngày 17 tháng 1 thông qua ngày 18 tháng 1

Đây là những liên kết của tôi cho ngày 17 tháng 1 đến tháng 18:

  • Twitter.com vs Twitter hệ sinh thái - Fred Wilson bình luận về một số dữ liệu từ John Borthwick cho thấy Twitter sử dụng hệ sinh thái = 3-5x Twitter.com trực tiếp.

    "Biểu đồ của John ước tính Twitter.com là khoảng 20mm UV một tháng tại Mỹ (comScore có nó ở 60mm UV trên toàn thế giới) và các hệ sinh thái Twitter vào khoảng 60mm UV ở Mỹ.

    Mà nói rằng trên tất cả các dịch vụ web, không chỉ AVC, hệ sinh thái Twitter là về 3x Twitter.com. Và trên blog này, mà khán giả chắc chắn là người sử dụng điện, tỷ lệ đó là 5x. "

  • Chris Walshaw :: Nghiên cứu :: Lưu trữ phân vùng - Chào mừng đến với Đại học Greenwich Biểu đồ phân vùng lưu trữ. Các kho lưu trữ bao gồm các phân vùng tốt nhất tìm thấy cho đến nay cho một loạt các biểu đồ và mục đích của nó là cung cấp một chuẩn mực, dựa vào đó các thuật toán phân vùng có thể được kiểm tra, và một nguồn tài nguyên để thử nghiệm.

    Các kho lưu trữ phân vùng đã hoạt động từ năm 2000 và bao gồm kết quả từ hầu hết các gói phần mềm phân vùng đồ thị lớn. Các nhà nghiên cứu phát triển các thuật toán phân vùng thử nghiệm thường xuyên trình phân vùng mới để đưa có thể.

    Hầu hết các đồ thị kiểm tra phát sinh từ các ứng dụng phân vùng điển hình, mặc dù các kho lưu trữ cũng bao gồm kết quả tính toán cho một bộ kiểm tra đồ thị màu [Wal04] chứa trong một phụ lục riêng biệt.

    Các kho lưu trữ ban đầu được thiết lập như là một phần của một dự án nghiên cứu phân vùng chất lượng rất cao và tác giả muốn đề cập đến các kho lưu trữ phân vùng nên trích dẫn bài báo [SWC04].

  • Thu thập thông tin «The Guy của Twitter sản phẩm - "Danh sách các sự cố ảnh hưởng đến thời gian tải trang của sản phẩm Twitter, phân biệt giữa tổng số thời gian chết, và một phần thời gian chết và thông tin bất khả tiếp cận, dựa trên các bài đăng công khai trên blog Twitter.

    http://status.twitter.com/archive

    Tôi đã làm hết sức mình để không tăng gấp đôi tính bất kỳ vấn đề, nhưng rất khó vì nhiều vấn đề xảy ra rất thường xuyên, và nó thường rất khó để phân biệt, từ những bài viết trên blog tình trạng một mình, giữa một vấn đề kiên trì được kinh nghiệm hoặc cố định, từ đó của một sự xuất hiện mới của một vấn đề tương tự hoặc giống nhau. Hơn nữa, tôi cũng loại trừ tác động trên Thời gian tải trang xuất phát từ kế hoạch bảo trì / thời gian chết - khoảng thời gian mà qua đó kỳ vọng người sử dụng sẽ được liên kết với hầu hết các lời hứa của sản phẩm của Thời gian tải trang. "

  • Soundboard.com - Soundboard.com là Danh mục của web lớn nhất của âm thanh miễn phí và soundboards - trong hơn 20 loại, cho điện thoại di động hoặc máy tính. 252.858 âm thanh miễn phí trên 17,171 soundboards từ phim đến thể thao, hiệu ứng âm thanh, truyền hình, người nổi tiếng, lịch sử và du lịch. Hoặc xây dựng, tùy chỉnh, địa chỉ mạng và quản lý của riêng bạn

Bookmark cho ngày 17 tháng 1 thông qua ngày 18 tháng 1

Đây là những liên kết của tôi cho ngày 17 tháng 1 đến tháng 18:

  • Twitter.com vs Twitter hệ sinh thái - Fred Wilson bình luận về một số dữ liệu từ John Borthwick cho thấy Twitter sử dụng hệ sinh thái = 3-5x Twitter.com trực tiếp.

    "Biểu đồ của John ước tính Twitter.com là khoảng 20mm UV một tháng tại Mỹ (comScore có nó ở 60mm UV trên toàn thế giới) và các hệ sinh thái Twitter vào khoảng 60mm UV ở Mỹ.

    Mà nói rằng trên tất cả các dịch vụ web, không chỉ AVC, hệ sinh thái Twitter là về 3x Twitter.com. Và trên blog này, mà khán giả chắc chắn là người sử dụng điện, tỷ lệ đó là 5x. "

  • Chris Walshaw :: Nghiên cứu :: Lưu trữ phân vùng - Chào mừng đến với Đại học Greenwich Biểu đồ phân vùng lưu trữ. Các kho lưu trữ bao gồm các phân vùng tốt nhất tìm thấy cho đến nay cho một loạt các biểu đồ và mục đích của nó là cung cấp một chuẩn mực, dựa vào đó các thuật toán phân vùng có thể được kiểm tra, và một nguồn tài nguyên để thử nghiệm.

    Các kho lưu trữ phân vùng đã hoạt động từ năm 2000 và bao gồm kết quả từ hầu hết các gói phần mềm phân vùng đồ thị lớn. Các nhà nghiên cứu phát triển các thuật toán phân vùng thử nghiệm thường xuyên trình phân vùng mới để đưa có thể.

    Hầu hết các đồ thị kiểm tra phát sinh từ các ứng dụng phân vùng điển hình, mặc dù các kho lưu trữ cũng bao gồm kết quả tính toán cho một bộ kiểm tra đồ thị màu [Wal04] chứa trong một phụ lục riêng biệt.

    Các kho lưu trữ ban đầu được thiết lập như là một phần của một dự án nghiên cứu phân vùng chất lượng rất cao và tác giả muốn đề cập đến các kho lưu trữ phân vùng nên trích dẫn bài báo [SWC04].

  • Thu thập thông tin «The Guy của Twitter sản phẩm - "Danh sách các sự cố ảnh hưởng đến thời gian tải trang của sản phẩm Twitter, phân biệt giữa tổng số thời gian chết, và một phần thời gian chết và thông tin bất khả tiếp cận, dựa trên các bài đăng công khai trên blog Twitter.

    http://status.twitter.com/archive

    Tôi đã làm hết sức mình để không tăng gấp đôi tính bất kỳ vấn đề, nhưng rất khó vì nhiều vấn đề xảy ra rất thường xuyên, và nó thường rất khó để phân biệt, từ những bài viết trên blog tình trạng một mình, giữa một vấn đề kiên trì được kinh nghiệm hoặc cố định, từ đó của một sự xuất hiện mới của một vấn đề tương tự hoặc giống nhau. Hơn nữa, tôi cũng loại trừ tác động trên Thời gian tải trang xuất phát từ kế hoạch bảo trì / thời gian chết - khoảng thời gian mà qua đó kỳ vọng người sử dụng sẽ được liên kết với hầu hết các lời hứa của sản phẩm của Thời gian tải trang. "

  • Soundboard.com - Soundboard.com là Danh mục của web lớn nhất của âm thanh miễn phí và soundboards - trong hơn 20 loại, cho điện thoại di động hoặc máy tính. 252.858 âm thanh miễn phí trên 17,171 soundboards từ phim đến thể thao, hiệu ứng âm thanh, truyền hình, người nổi tiếng, lịch sử và du lịch. Hoặc xây dựng, tùy chỉnh, địa chỉ mạng và quản lý của riêng bạn

Bookmark cho ngày 17 tháng 1 thông qua ngày 18 tháng 1

Đây là những liên kết của tôi cho ngày 17 tháng 1 đến tháng 18:

  • Twitter.com vs Twitter hệ sinh thái - Fred Wilson bình luận về một số dữ liệu từ John Borthwick cho thấy Twitter sử dụng hệ sinh thái = 3-5x Twitter.com trực tiếp.

    "Biểu đồ của John ước tính Twitter.com là khoảng 20mm UV một tháng tại Mỹ (comScore có nó ở 60mm UV trên toàn thế giới) và các hệ sinh thái Twitter vào khoảng 60mm UV ở Mỹ.

    Mà nói rằng trên tất cả các dịch vụ web, không chỉ AVC, hệ sinh thái Twitter là về 3x Twitter.com. Và trên blog này, mà khán giả chắc chắn là người sử dụng điện, tỷ lệ đó là 5x. "

  • Chris Walshaw :: Nghiên cứu :: Lưu trữ phân vùng - Chào mừng đến với Đại học Greenwich Biểu đồ phân vùng lưu trữ. Các kho lưu trữ bao gồm các phân vùng tốt nhất tìm thấy cho đến nay cho một loạt các biểu đồ và mục đích của nó là cung cấp một chuẩn mực, dựa vào đó các thuật toán phân vùng có thể được kiểm tra, và một nguồn tài nguyên để thử nghiệm.

    Các kho lưu trữ phân vùng đã hoạt động từ năm 2000 và bao gồm kết quả từ hầu hết các gói phần mềm phân vùng đồ thị lớn. Các nhà nghiên cứu phát triển các thuật toán phân vùng thử nghiệm thường xuyên trình phân vùng mới để đưa có thể.

    Hầu hết các đồ thị kiểm tra phát sinh từ các ứng dụng phân vùng điển hình, mặc dù các kho lưu trữ cũng bao gồm kết quả tính toán cho một bộ kiểm tra đồ thị màu [Wal04] chứa trong một phụ lục riêng biệt.

    Các kho lưu trữ ban đầu được thiết lập như là một phần của một dự án nghiên cứu phân vùng chất lượng rất cao và tác giả muốn đề cập đến các kho lưu trữ phân vùng nên trích dẫn bài báo [SWC04].

  • Thu thập thông tin «The Guy của Twitter sản phẩm - "Danh sách các sự cố ảnh hưởng đến thời gian tải trang của sản phẩm Twitter, phân biệt giữa tổng số thời gian chết, và một phần thời gian chết và thông tin bất khả tiếp cận, dựa trên các bài đăng công khai trên blog Twitter.

    http://status.twitter.com/archive

    Tôi đã làm hết sức mình để không tăng gấp đôi tính bất kỳ vấn đề, nhưng rất khó vì nhiều vấn đề xảy ra rất thường xuyên, và nó thường rất khó để phân biệt, từ những bài viết trên blog tình trạng một mình, giữa một vấn đề kiên trì được kinh nghiệm hoặc cố định, từ đó của một sự xuất hiện mới của một vấn đề tương tự hoặc giống nhau. Hơn nữa, tôi cũng loại trừ tác động trên Thời gian tải trang xuất phát từ kế hoạch bảo trì / thời gian chết - khoảng thời gian mà qua đó kỳ vọng người sử dụng sẽ được liên kết với hầu hết các lời hứa của sản phẩm của Thời gian tải trang. "

  • Soundboard.com - Soundboard.com là Danh mục của web lớn nhất của âm thanh miễn phí và soundboards - trong hơn 20 loại, cho điện thoại di động hoặc máy tính. 252.858 âm thanh miễn phí trên 17,171 soundboards từ phim đến thể thao, hiệu ứng âm thanh, truyền hình, người nổi tiếng, lịch sử và du lịch. Hoặc xây dựng, tùy chỉnh, địa chỉ mạng và quản lý của riêng bạn

Bookmark cho ngày 17 tháng 1 21:37-21:53

Đây là những liên kết của tôi cho ngày 17 tháng 1 21:37-21:53:

  • Thu thập thông tin «The Guy của Twitter sản phẩm - "Danh sách các sự cố ảnh hưởng đến thời gian tải trang của sản phẩm Twitter, phân biệt giữa tổng số thời gian chết, và một phần thời gian chết và thông tin bất khả tiếp cận, dựa trên các bài đăng công khai trên blog Twitter.

    http://status.twitter.com/archive

    Tôi đã làm hết sức mình để không tăng gấp đôi tính bất kỳ vấn đề, nhưng rất khó vì nhiều vấn đề xảy ra rất thường xuyên, và nó thường rất khó để phân biệt, từ những bài viết trên blog tình trạng một mình, giữa một vấn đề kiên trì được kinh nghiệm hoặc cố định, từ đó của một sự xuất hiện mới của một vấn đề tương tự hoặc giống nhau. Hơn nữa, tôi cũng loại trừ tác động trên Thời gian tải trang xuất phát từ kế hoạch bảo trì / thời gian chết - khoảng thời gian mà qua đó kỳ vọng người sử dụng sẽ được liên kết với hầu hết các lời hứa của sản phẩm của Thời gian tải trang. "

  • Soundboard.com - Soundboard.com là Danh mục của web lớn nhất của âm thanh miễn phí và soundboards - trong hơn 20 loại, cho điện thoại di động hoặc máy tính. 252.858 âm thanh miễn phí trên 17,171 soundboards từ phim đến thể thao, hiệu ứng âm thanh, truyền hình, người nổi tiếng, lịch sử và du lịch. Hoặc xây dựng, tùy chỉnh, địa chỉ mạng và quản lý của riêng bạn

Bookmark cho 31 tháng 12 thông qua ngày 17 tháng một

Đây là những liên kết của tôi cho ngày 31 tháng 12 đến tháng 17:

  • Khan Academy - Học viện Khan là một tổ chức phi lợi nhuận với nhiệm vụ cung cấp một nền giáo dục chất lượng cao cho bất cứ ai, bất cứ nơi nào.

    Chúng ta có 1000 + video trên YouTube bao gồm tất cả mọi thứ từ số học cơ bản và đại số để phương trình vi phân, vật lý, hóa học, sinh học và tài chính đã được ghi nhận bởi Salman Khan.

  • AI cạnh tranh StarCraft | ý nghĩa thông minh Studio - AI cạnh tranh chiến tranh bot sử dụng một API hack để chạy StarCraft, sẽ được tổ chức tại AIIDE2010 trong tháng 10 năm 2010.
    Cuộc thi sẽ sử dụng StarCraft Brood War 1.16.1. Chương trình cho StarCraft có thể được phát triển bằng cách sử dụng API Broodwar, cung cấp móc vào StarCraft và cho phép sự phát triển của các tùy chỉnh AI cho StarCraft. Một C + + giao diện cho phép các nhà phát triển để truy vấn trạng thái hiện tại của trò chơi và vấn đề đơn đặt hàng cho các đơn vị. Giới thiệu về API Broodwar có sẵn ở đây. Hướng dẫn xây dựng một bot giao tiếp với một quá trình từ xa có sẵn ở đây. Ngoài ra còn có một diễn đàn. Chúng tôi khuyến khích nộp hồ sơ của chương trình mà làm cho việc sử dụng các kỹ thuật tiên tiến AI. Một số ý tưởng là:
    * Kế hoạch
    * Khai thác dữ liệu
    * Học máy
    * Case-Based Reasoning
  • Các biện pháp đo: Tìm hiểu về học thống kê - Một "hướng dẫn nhanh" cho các hệ thống học tập thống kê và máy móc, bộ sưu tập tốt của tài liệu tham khảo.
  • Berkowitz và cộng sự: Việc sử dụng các phương pháp chính thức để lập bản đồ, phân tích và giải thích và hệ thống hawala chuyển tiền thay thế khủng bố liên quan đến (2006) - Berkowitz, Steven D., Woodward, Lloyd H., và Woodward, Caitlin. (2006). Sử dụng các phương pháp chính thức để lập bản đồ, phân tích và giải thích và hệ thống hawala nộp thay thế khủng bố liên quan đến. Ban đầu dự định cho xuất bản trong việc cập nhật khối lượng năm 1988, biên tập, Wellman và Berkowitz, cấu trúc xã hội:. Một phương pháp mạng (Cambridge University Press). Steve đã qua đời vào tháng Mười năm 2003 Xem Barry Wellman của "Steve Berkowitz: Một người tiên phong mạng đã qua đời,". Trong kết nối 25 (2), 2003 Đó không phải là có thể để thêm các cập nhật của tài liệu tham khảo hoặc về chất lượng đồ họa có thể. có được, nếu Berkowitz còn sống. Phiên bản đầu tiên của bài báo xuất hiện trong Kỷ yếu của kỳ họp về chống khủng bố mạng: Nghiên cứu hiện tại trong xã hội Phân tích mạng cho cuộc chiến mới đấu Môi trường. 8 lệnh quốc tế và kiểm soát nghiên cứu và Công nghệ Hội nghị chuyên đề. Đại học Quốc phòng, Washington, DC ngày 17-ngày 19 Tháng Sáu, 2003
  • SSH Tunneling thông qua các bộ lọc web | s-anand.net - Từng bước hướng dẫn về sử dụng Putty và một thể EC2 để thiết lập một proxy web tin theo yêu cầu.
  • PyDroid giao diện bộ công cụ tự động hóa - GitHub - Pydroid là gì?

    Pydroid là một bộ công cụ đơn giản để tự động hoá và nhiệm vụ lặp đi lặp lại kịch bản, đặc biệt là những liên quan đến một giao diện đồ họa, với Python. Nó bao gồm các chức năng cho việc kiểm soát chuột và bàn phím, tìm kiếm màu sắc và bitmap trên màn hình, cũng như hiển thị cảnh báo nền tảng.
    Tại sao sử dụng Pydroid?

    * Kiểm tra một ứng dụng giao diện đồ họa cho các lỗi và các trường hợp cạnh
    o Bạn có thể nghĩ ứng dụng của bạn là ổn định, nhưng những gì xảy ra nếu bạn bấm nút 5000 lần?
    * Tự động hoá trò chơi
    o Viết một kịch bản để đánh bại đó không hấp dẫn trò chơi flash có thể được nhiều hơn nữa hài lòng hơn so với chi tiêu giờ chơi nó cho mình.
    * Freaking ra bạn bè và gia đình
    o Cũng có thể đây là không thực sự là một thực tế sử dụng, nhưng ...

  • Hiện thư viện dữ liệu Series - Thêm bộ dữ liệu - "Đây là một bộ sưu tập khoảng 800 chuỗi thời gian rút ra từ nhiều khác nhau fields.Agriculture Hóa học tội phạm Nhân khẩu học Sinh thái Tài chính Y tế Công nghiệp Thủy văn thị trường lao động vĩ mô Kinh tế vi mô Kinh tế Khí tượng khác Vật lý sản xuất kinh doanh mô phỏng loạt thể thao Vận tải & Du lịch Tree-vòng Utilities "
  • Làm thế nào thông tin là Twitter? »SemanticHacker Blog -.. "Chúng tôi đã tiến hành một nghiên cứu nhỏ để mô tả các loại tin nhắn có thể được tìm thấy trên Twitter Chúng tôi đã tải về một mẫu tweet của quý vị trong thời gian hai tuần sử dụng Twitter trực tuyến API Điều này dẫn đến một ngữ liệu của 8,9 triệu tin nhắn ("tweet") được đăng tải 2,6 triệu người dùng. Về 2,7 triệu của các tweet của quý vị, hoặc 31%, đã trả lời cho một tweet được đăng bởi người dùng khác, trong khi một nửa triệu (6%) là retweets. Gần 2 triệu (22 %) của các tin nhắn có chứa một URL. "
  • Gremlin - một tính Turing hoàn tất, biểu đồ dựa trên ngôn ngữ lập trình - GitHub - Gremlin là một Turing-đầy đủ, dựa trên đồ thị ngôn ngữ lập trình được phát triển trong Java 1.6 + cho / giá trị cặp đồ thị đa quan hệ quan trọng được gọi là đồ thị bất động sản. Gremlin làm cho sử dụng rộng rãi của XPath 1.0 ngôn ngữ để hỗ trợ traversals biểu đồ phức tạp. Ngôn ngữ này có những ứng dụng trong các lĩnh vực truy vấn biểu đồ, phân tích, và thao tác. Kết nối tồn tại cho các hệ thống quản lý dữ liệu sau đây:

    * TinkerGraph trong bộ nhớ đồ thị
    * Đồ thị Neo4j cơ sở dữ liệu
    * Sesame 2.0 RDF cửa hàng phù hợp
    * Cơ sở dữ liệu tài liệu MongoDB

    Các tài liệu cho Gremlin có thể được tìm thấy tại địa điểm này. Cuối cùng, vui lòng truy cập TinkerPop cho các sản phẩm phần mềm khác.

  • C Ngôn ngữ lập trình: 4.10 - bởi Kernighan và Ritchie & Lovecraft - mất hiệu lực Rlyeh
    (Int Mene [], int wgah, int nagl) {
    int Ia, fhtagn;
    if (wgah> = nagl) trở lại;
    trao đổi (Mene, wgah, (wgah + nagl) / 2);
    fhtagn = wgah;
    cho (Ia = wgah 1; Ia <= nagl; Ia + +)
    if (Mene [Ia] <Mene [wgah])
    trao đổi (Mene, + + fhtagn, Ia);
    trao đổi (Mene, wgah, fhtagn);
    Rlyeh (Mene, wgah, fhtagn-1);
    Rlyeh (Mene, fhtagn +1, nagl);

    } / / PH'NGLUI MGLW'NAFH Cthulhu!

  • Làm thế nào để chuyển đổi địa chỉ email vào tên, tuổi, dân tộc, khuynh hướng tình dục - Vậy là không Meta - "Lưu danh sách email của bạn như là một tập tin CSV (chỉ dấu phẩy tách các địa chỉ email) Tải lên tập tin này vào tài khoản facebook của bạn nếu như bạn muốn. thêm chúng như bạn bè. Thì đấy, facebook sẽ cung cấp cho bạn tất cả các hồ sơ của tất cả những người sử dụng (trong thử nghiệm của tôi, khoảng 80% danh sách email của tôi có hồ sơ facebook). Bây giờ, bấm vào thông qua mỗi hồ sơ, và bởi vì các thiết lập mặc định facebook mới , mà làm cho tất cả công chúng thông tin, khoảng 95% người sử dụng các thông tin có sẵn để bạn có thể thu hoạch. "
  • Microsoft Security Development Lifecycle (SDL): Công cụ Repository - Một bộ sưu tập trước đây chỉ dành cho nội công cụ bảo mật của Microsoft, bao gồm cả chống XSS, kiểm tra lông tơ, FxCop, mô hình hóa mối đe dọa, binscope, bây giờ đã có thể download miễn phí.
  • Phân tích X Prize - Trang chủ - Dự báo tỷ lệ giết người ở Philadelphia - Giải thưởng Analytics X là một cuộc thi đang diễn ra để áp dụng phân tích, mô hình hóa, và thống kê để giải quyết các vấn đề xã hội có ảnh hưởng đến các thành phố của chúng tôi. Nó kết hợp các lĩnh vực thống kê, toán học, và khoa học xã hội để hiểu được nguyên nhân gốc rễ của rối loạn chức năng trong các khu phố của chúng tôi. Sự hiểu biết các mối quan hệ và phát hiện các biến tương quan cao nhất cho phép chúng tôi triển khai nguồn lực hạn chế của chúng tôi hiệu quả hơn và nhắm mục tiêu các biến sẽ có tác động tích cực lớn nhất về cải thiện.
  • PeteSearch: Làm thế nào để tìm thấy thông tin người sử dụng từ một địa chỉ email - Mã FindByEmail phát hành mã nguồn mở. Bạn vượt qua nó một địa chỉ email, và nó truy vấn 11 API công cộng khác nhau để khám phá các dịch vụ thông tin gì có trên người sử dụng với địa chỉ email.
  • Các biện pháp đo: Ngoài PageRank: Học tập với nội dung và mạng lưới - Kết luận: học tập dựa trên nội dung và dữ liệu mạng là tình trạng hiện nay của nghệ thuật Có một giấy tuyệt vời và nói về cá nhân trong Google News rằng họ sử dụng nội dung cho mục đích này, và sau đó người sử dụng nhấp vào dòng để cung cấp cá nhân, tức là giới thiệu bài viết cụ thể trong từng cụm tại chỗ. Vấn đề là lọc nội dung thường (như chúng tôi nói trong nghiên cứu) "cách khó khăn hơn." Giả sử bạn có một đồ thị xã hội, một loạt các tài liệu, và bạn biết rằng một số người dùng trong đồ thị xã hội như một số tài liệu, và bạn muốn giới thiệu các tài liệu khác mà bạn nghĩ rằng họ sẽ thích. Sử dụng phương pháp tiếp cận dựa trên mạng, bạn có thể xem xét phân nhóm người dùng dựa trên đồng visitaion (họ đã cùng thích một số tài liệu). Quy mô này tuyệt vời, và nó internationalizes tuyệt vời. Nếu bạn bắt đầu giải nén các tính năng từ các tài liệu bản thân, thì những gì bạn xây dựng cho tiếng Anh có thể không làm việc tốt cho thị trường Trung Quốc. Ngoài ra, có rất nhiều dữ liệu trong văn bản hơn là trong đồ thị xã hội
  • mikemaccana's python-docx at master – GitHub – MIT-licensed Python library to read/write Microsoft Word docx format files. "The docx module reads and writes Microsoft Office Word 2007 docx files. These are referred to as 'WordML', 'Office Open XML' and 'Open XML' by Microsoft. They can be opened in Microsoft Office 2007, Microsoft Mac Office 2008, OpenOffice.org 2.2, and Apple iWork 08. The module was created when I was looking for a Python support for MS Word .doc files, but could only find various hacks involving COM automation, calling .net or Java, or automating OpenOffice or MS Office."

Bookmarks for December 31st through January 16th

These are my links for December 31st through January 16th:

  • StarCraft AI Competition | Expressive Intelligence Studio – AI bot warfare competition using a hacked API to run StarCraft, will be held at AIIDE2010 in October 2010.
    The competition will use StarCraft Brood War 1.16.1. Bots for StarCraft can be developed using the Broodwar API, which provides hooks into StarCraft and enables the development of custom AI for StarCraft. A C++ interface enables developers to query the current state of the game and issue orders to units. An introduction to the Broodwar API is available here. Instructions for building a bot that communicates with a remote process are available here. There is also a Forum. We encourage submission of bots that make use of advanced AI techniques. Some ideas are:
    * Planning
    * Data Mining
    * Machine Learning
    * Case-Based Reasoning
  • Measuring Measures: Learning About Statistical Learning – A "quick start guide" for statistical and machine learning systems, good collection of references.
  • Berkowitz et al : The use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems (2006) – Berkowitz, Steven D., Woodward, Lloyd H., & Woodward, Caitlin. (2006). Use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems. Originally intended for publication in updating the 1988 volume, eds., Wellman and Berkowitz, Social Structures: A Network Approach (Cambridge University Press). Steve died in November, 2003. See Barry Wellman's “Steve Berkowitz: A Network Pioneer has passed away,” in Connections 25(2), 2003. It has not been possible to add the updating of references or of the quality of graphics that might have been possible if Berkowitz were alive. An early version of the article appeared in the Proceedings of the Session on Combating Terrorist Networks: Current Research in Social Network Analysis for the New War Fighting Environment. 8th International Command and Control Research and Technology Symposium. National Defense University, Washington, DC June 17-19, 2003
  • SSH Tunneling through web filters | s-anand.net – Step by step tutorial on using Putty and an EC2 instance to set up a private web proxy on demand.
  • PyDroid GUI automation toolkit – GitHub – What is Pydroid?

    Pydroid is a simple toolkit for automating and scripting repetitive tasks, especially those involving a GUI, with Python. It includes functions for controlling the mouse and keyboard, finding colors and bitmaps on-screen, as well as displaying cross-platform alerts.
    Why use Pydroid?

    * Testing a GUI application for bugs and edge cases
    o You might think your app is stable, but what happens if you press that button 5000 times?
    * Automating games
    o Writing a script to beat that crappy flash game can be so much more gratifying than spending hours playing it yourself.
    * Freaking out friends and family
    o Well maybe this isn't really a practical use, but…

  • Time Series Data Library – More data sets – "This is a collection of about 800 time series drawn from many different fields.Agriculture Chemistry Crime Demography Ecology Finance Health Hydrology Industry Labour Market Macro-Economics Meteorology Micro-Economics Miscellaneous Physics Production Sales Simulated series Sport Transport & Tourism Tree-rings Utilities"
  • How informative is Twitter? » SemanticHacker Blog – "We undertook a small study to characterize the different types of messages that can be found on Twitter. We downloaded a sample of tweets over a two-week period using the Twitter streaming API. This resulted in a corpus of 8.9 million messages (”tweets”) posted by 2.6 million unique users. About 2.7 million of these tweets, or 31%, were replies to a tweet posted by another user, while half a million (6%) were retweets. Almost 2 million (22%) of the messages contained a URL."
  • Gremlin – a Turing-complete, graph-based programming language – GitHub – Gremlin is a Turing-complete, graph-based programming language developed in Java 1.6+ for key/value-pair multi-relational graphs known as property graphs. Gremlin makes extensive use of the XPath 1.0 language to support complex graph traversals. This language has applications in the areas of graph query, analysis, and manipulation. Connectors exist for the following data management systems:

    * TinkerGraph in-memory graph
    * Neo4j graph database
    * Sesame 2.0 compliant RDF stores
    * MongoDB document database

    The documentation for Gremlin can be found at this location. Finally, please visit TinkerPop for other software products.

  • The C Programming Language: 4.10 – by Kernighan & Ritchie & Lovecraft – void Rlyeh
    (int mene[], int wgah, int nagl) {
    int Ia, fhtagn;
    if (wgah>=nagl) return;
    swap (mene,wgah,(wgah+nagl)/2);
    fhtagn = wgah;
    for (Ia=wgah+1; Ia<=nagl; Ia++)
    if (mene[Ia]<mene[wgah])
    swap (mene,++fhtagn,Ia);
    swap (mene,wgah,fhtagn);
    Rlyeh (mene,wgah,fhtagn-1);
    Rlyeh (mene,fhtagn+1,nagl);

    } // PH'NGLUI MGLW'NAFH CTHULHU!

  • How to convert email addresses into name, age, ethnicity, sexual orientation – This is so Meta – "Save your email list as a CSV file (just comma separate those email addresses). Upload this file to your facebook account as if you wanted to add them as friends. Voila, facebook will give you all the profiles of all those users (in my test, about 80% of my email lists have facebook profiles). Now, click through each profile, and because of the new default facebook settings, which makes all information public, about 95% of the user info is available for you to harvest."
  • Microsoft Security Development Lifecycle (SDL): Tools Repository – A collection of previously internal-only security tools from Microsoft, including anti-xss, fuzz test, fxcop, threat modeling, binscope, now available for free download.
  • Analytics X Prize – Home – Forecast the murder rate in Philadelphia – The Analytics X Prize is an ongoing contest to apply analytics, modeling, and statistics to solve the social problems that affect our cities. It combines the fields of statistics, mathematics, and social science to understand the root causes of dysfunction in our neighborhoods. Understanding these relationships and discovering the most highly correlated variables allows us to deploy our limited resources more effectively and target the variables that will have the greatest positive impact on improvement.
  • PeteSearch: How to find user information from an email address – FindByEmail code released as open-source. You pass it an email address, and it queries 11 different public APIs to discover what information those services have on the user with that email address.
  • Measuring Measures: Beyond PageRank: Learning with Content and Networks – Conclusion: learning based on content and network data is the current state of the art There is a great paper and talk about personalization in Google News they use content for this purpose, and then user click streams to provide personalization, ie recommend specific articles within each topical cluster. The issue is content filtering is typically (as we say in research) "way harder." Suppose you have a social graph, a bunch of documents, and you know that some users in the social graph like some documents, and you want to recommend other documents that you think they will like. Using approaches based on Networks, you might consider clustering users based on co-visitaion (they have co-liked some of the documents). This scales great, and it internationalizes great. If you start extracting features from the documents themselves, then what you build for English may not work as well for the Chinese market. In addition, there is far more data in the text than there is in the social graph
  • mikemaccana's python-docx at master – GitHub – MIT-licensed Python library to read/write Microsoft Word docx format files. "The docx module reads and writes Microsoft Office Word 2007 docx files. These are referred to as 'WordML', 'Office Open XML' and 'Open XML' by Microsoft. They can be opened in Microsoft Office 2007, Microsoft Mac Office 2008, OpenOffice.org 2.2, and Apple iWork 08. The module was created when I was looking for a Python support for MS Word .doc files, but could only find various hacks involving COM automation, calling .net or Java, or automating OpenOffice or MS Office."

Bookmarks for December 31st through January 17th

These are my links for December 31st through January 17th:

  • Khan Academy – The Khan Academy is a not-for-profit organization with the mission of providing a high quality education to anyone, anywhere.

    We have 1000+ videos on YouTube covering everything from basic arithmetic and algebra to differential equations, physics, chemistry, biology and finance which have been recorded by Salman Khan.

  • StarCraft AI Competition | Expressive Intelligence Studio – AI bot warfare competition using a hacked API to run StarCraft, will be held at AIIDE2010 in October 2010.
    The competition will use StarCraft Brood War 1.16.1. Bots for StarCraft can be developed using the Broodwar API, which provides hooks into StarCraft and enables the development of custom AI for StarCraft. A C++ interface enables developers to query the current state of the game and issue orders to units. An introduction to the Broodwar API is available here. Instructions for building a bot that communicates with a remote process are available here. There is also a Forum. We encourage submission of bots that make use of advanced AI techniques. Some ideas are:
    * Planning
    * Data Mining
    * Machine Learning
    * Case-Based Reasoning
  • Measuring Measures: Learning About Statistical Learning – A "quick start guide" for statistical and machine learning systems, good collection of references.
  • Berkowitz et al : The use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems (2006) – Berkowitz, Steven D., Woodward, Lloyd H., & Woodward, Caitlin. (2006). Use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems. Originally intended for publication in updating the 1988 volume, eds., Wellman and Berkowitz, Social Structures: A Network Approach (Cambridge University Press). Steve died in November, 2003. See Barry Wellman's “Steve Berkowitz: A Network Pioneer has passed away,” in Connections 25(2), 2003. It has not been possible to add the updating of references or of the quality of graphics that might have been possible if Berkowitz were alive. An early version of the article appeared in the Proceedings of the Session on Combating Terrorist Networks: Current Research in Social Network Analysis for the New War Fighting Environment. 8th International Command and Control Research and Technology Symposium. National Defense University, Washington, DC June 17-19, 2003
  • SSH Tunneling through web filters | s-anand.net – Step by step tutorial on using Putty and an EC2 instance to set up a private web proxy on demand.
  • PyDroid GUI automation toolkit – GitHub – What is Pydroid?

    Pydroid is a simple toolkit for automating and scripting repetitive tasks, especially those involving a GUI, with Python. It includes functions for controlling the mouse and keyboard, finding colors and bitmaps on-screen, as well as displaying cross-platform alerts.
    Why use Pydroid?

    * Testing a GUI application for bugs and edge cases
    o You might think your app is stable, but what happens if you press that button 5000 times?
    * Automating games
    o Writing a script to beat that crappy flash game can be so much more gratifying than spending hours playing it yourself.
    * Freaking out friends and family
    o Well maybe this isn't really a practical use, but…

  • Time Series Data Library – More data sets – "This is a collection of about 800 time series drawn from many different fields.Agriculture Chemistry Crime Demography Ecology Finance Health Hydrology Industry Labour Market Macro-Economics Meteorology Micro-Economics Miscellaneous Physics Production Sales Simulated series Sport Transport & Tourism Tree-rings Utilities"
  • How informative is Twitter? » SemanticHacker Blog – "We undertook a small study to characterize the different types of messages that can be found on Twitter. We downloaded a sample of tweets over a two-week period using the Twitter streaming API. This resulted in a corpus of 8.9 million messages (”tweets”) posted by 2.6 million unique users. About 2.7 million of these tweets, or 31%, were replies to a tweet posted by another user, while half a million (6%) were retweets. Almost 2 million (22%) of the messages contained a URL."
  • Gremlin – a Turing-complete, graph-based programming language – GitHub – Gremlin is a Turing-complete, graph-based programming language developed in Java 1.6+ for key/value-pair multi-relational graphs known as property graphs. Gremlin makes extensive use of the XPath 1.0 language to support complex graph traversals. This language has applications in the areas of graph query, analysis, and manipulation. Connectors exist for the following data management systems:

    * TinkerGraph in-memory graph
    * Neo4j graph database
    * Sesame 2.0 compliant RDF stores
    * MongoDB document database

    The documentation for Gremlin can be found at this location. Finally, please visit TinkerPop for other software products.

  • The C Programming Language: 4.10 – by Kernighan & Ritchie & Lovecraft – void Rlyeh
    (int mene[], int wgah, int nagl) {
    int Ia, fhtagn;
    if (wgah>=nagl) return;
    swap (mene,wgah,(wgah+nagl)/2);
    fhtagn = wgah;
    for (Ia=wgah+1; Ia<=nagl; Ia++)
    if (mene[Ia]<mene[wgah])
    swap (mene,++fhtagn,Ia);
    swap (mene,wgah,fhtagn);
    Rlyeh (mene,wgah,fhtagn-1);
    Rlyeh (mene,fhtagn+1,nagl);

    } // PH'NGLUI MGLW'NAFH CTHULHU!

  • How to convert email addresses into name, age, ethnicity, sexual orientation – This is so Meta – "Save your email list as a CSV file (just comma separate those email addresses). Upload this file to your facebook account as if you wanted to add them as friends. Voila, facebook will give you all the profiles of all those users (in my test, about 80% of my email lists have facebook profiles). Now, click through each profile, and because of the new default facebook settings, which makes all information public, about 95% of the user info is available for you to harvest."
  • Microsoft Security Development Lifecycle (SDL): Tools Repository – A collection of previously internal-only security tools from Microsoft, including anti-xss, fuzz test, fxcop, threat modeling, binscope, now available for free download.
  • Analytics X Prize – Home – Forecast the murder rate in Philadelphia – The Analytics X Prize is an ongoing contest to apply analytics, modeling, and statistics to solve the social problems that affect our cities. It combines the fields of statistics, mathematics, and social science to understand the root causes of dysfunction in our neighborhoods. Understanding these relationships and discovering the most highly correlated variables allows us to deploy our limited resources more effectively and target the variables that will have the greatest positive impact on improvement.
  • PeteSearch: How to find user information from an email address – FindByEmail code released as open-source. You pass it an email address, and it queries 11 different public APIs to discover what information those services have on the user with that email address.
  • Measuring Measures: Beyond PageRank: Learning with Content and Networks – Conclusion: learning based on content and network data is the current state of the art There is a great paper and talk about personalization in Google News they use content for this purpose, and then user click streams to provide personalization, ie recommend specific articles within each topical cluster. The issue is content filtering is typically (as we say in research) "way harder." Suppose you have a social graph, a bunch of documents, and you know that some users in the social graph like some documents, and you want to recommend other documents that you think they will like. Using approaches based on Networks, you might consider clustering users based on co-visitaion (they have co-liked some of the documents). This scales great, and it internationalizes great. If you start extracting features from the documents themselves, then what you build for English may not work as well for the Chinese market. In addition, there is far more data in the text than there is in the social graph
  • mikemaccana's python-docx at master – GitHub – MIT-licensed Python library to read/write Microsoft Word docx format files. "The docx module reads and writes Microsoft Office Word 2007 docx files. These are referred to as 'WordML', 'Office Open XML' and 'Open XML' by Microsoft. They can be opened in Microsoft Office 2007, Microsoft Mac Office 2008, OpenOffice.org 2.2, and Apple iWork 08. The module was created when I was looking for a Python support for MS Word .doc files, but could only find various hacks involving COM automation, calling .net or Java, or automating OpenOffice or MS Office."

Bookmarks for December 31st through January 17th

These are my links for December 31st through January 17th:

  • Khan Academy – The Khan Academy is a not-for-profit organization with the mission of providing a high quality education to anyone, anywhere.

    We have 1000+ videos on YouTube covering everything from basic arithmetic and algebra to differential equations, physics, chemistry, biology and finance which have been recorded by Salman Khan.

  • StarCraft AI Competition | Expressive Intelligence Studio – AI bot warfare competition using a hacked API to run StarCraft, will be held at AIIDE2010 in October 2010.
    The competition will use StarCraft Brood War 1.16.1. Bots for StarCraft can be developed using the Broodwar API, which provides hooks into StarCraft and enables the development of custom AI for StarCraft. A C++ interface enables developers to query the current state of the game and issue orders to units. An introduction to the Broodwar API is available here. Instructions for building a bot that communicates with a remote process are available here. There is also a Forum. We encourage submission of bots that make use of advanced AI techniques. Some ideas are:
    * Planning
    * Data Mining
    * Machine Learning
    * Case-Based Reasoning
  • Measuring Measures: Learning About Statistical Learning – A "quick start guide" for statistical and machine learning systems, good collection of references.
  • Berkowitz et al : The use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems (2006) – Berkowitz, Steven D., Woodward, Lloyd H., & Woodward, Caitlin. (2006). Use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems. Originally intended for publication in updating the 1988 volume, eds., Wellman and Berkowitz, Social Structures: A Network Approach (Cambridge University Press). Steve died in November, 2003. See Barry Wellman's “Steve Berkowitz: A Network Pioneer has passed away,” in Connections 25(2), 2003. It has not been possible to add the updating of references or of the quality of graphics that might have been possible if Berkowitz were alive. An early version of the article appeared in the Proceedings of the Session on Combating Terrorist Networks: Current Research in Social Network Analysis for the New War Fighting Environment. 8th International Command and Control Research and Technology Symposium. National Defense University, Washington, DC June 17-19, 2003
  • SSH Tunneling through web filters | s-anand.net – Step by step tutorial on using Putty and an EC2 instance to set up a private web proxy on demand.
  • PyDroid GUI automation toolkit – GitHub – What is Pydroid?

    Pydroid is a simple toolkit for automating and scripting repetitive tasks, especially those involving a GUI, with Python. It includes functions for controlling the mouse and keyboard, finding colors and bitmaps on-screen, as well as displaying cross-platform alerts.
    Why use Pydroid?

    * Testing a GUI application for bugs and edge cases
    o You might think your app is stable, but what happens if you press that button 5000 times?
    * Automating games
    o Writing a script to beat that crappy flash game can be so much more gratifying than spending hours playing it yourself.
    * Freaking out friends and family
    o Well maybe this isn't really a practical use, but…

  • Time Series Data Library – More data sets – "This is a collection of about 800 time series drawn from many different fields.Agriculture Chemistry Crime Demography Ecology Finance Health Hydrology Industry Labour Market Macro-Economics Meteorology Micro-Economics Miscellaneous Physics Production Sales Simulated series Sport Transport & Tourism Tree-rings Utilities"
  • How informative is Twitter? » SemanticHacker Blog – "We undertook a small study to characterize the different types of messages that can be found on Twitter. We downloaded a sample of tweets over a two-week period using the Twitter streaming API. This resulted in a corpus of 8.9 million messages (”tweets”) posted by 2.6 million unique users. About 2.7 million of these tweets, or 31%, were replies to a tweet posted by another user, while half a million (6%) were retweets. Almost 2 million (22%) of the messages contained a URL."
  • Gremlin – a Turing-complete, graph-based programming language – GitHub – Gremlin is a Turing-complete, graph-based programming language developed in Java 1.6+ for key/value-pair multi-relational graphs known as property graphs. Gremlin makes extensive use of the XPath 1.0 language to support complex graph traversals. This language has applications in the areas of graph query, analysis, and manipulation. Connectors exist for the following data management systems:

    * TinkerGraph in-memory graph
    * Neo4j graph database
    * Sesame 2.0 compliant RDF stores
    * MongoDB document database

    The documentation for Gremlin can be found at this location. Finally, please visit TinkerPop for other software products.

  • The C Programming Language: 4.10 – by Kernighan & Ritchie & Lovecraft – void Rlyeh
    (int mene[], int wgah, int nagl) {
    int Ia, fhtagn;
    if (wgah>=nagl) return;
    swap (mene,wgah,(wgah+nagl)/2);
    fhtagn = wgah;
    for (Ia=wgah+1; Ia<=nagl; Ia++)
    if (mene[Ia]<mene[wgah])
    swap (mene,++fhtagn,Ia);
    swap (mene,wgah,fhtagn);
    Rlyeh (mene,wgah,fhtagn-1);
    Rlyeh (mene,fhtagn+1,nagl);

    } // PH'NGLUI MGLW'NAFH CTHULHU!

  • How to convert email addresses into name, age, ethnicity, sexual orientation – This is so Meta – "Save your email list as a CSV file (just comma separate those email addresses). Upload this file to your facebook account as if you wanted to add them as friends. Voila, facebook will give you all the profiles of all those users (in my test, about 80% of my email lists have facebook profiles). Now, click through each profile, and because of the new default facebook settings, which makes all information public, about 95% of the user info is available for you to harvest."
  • Microsoft Security Development Lifecycle (SDL): Tools Repository – A collection of previously internal-only security tools from Microsoft, including anti-xss, fuzz test, fxcop, threat modeling, binscope, now available for free download.
  • Analytics X Prize – Home – Forecast the murder rate in Philadelphia – The Analytics X Prize is an ongoing contest to apply analytics, modeling, and statistics to solve the social problems that affect our cities. It combines the fields of statistics, mathematics, and social science to understand the root causes of dysfunction in our neighborhoods. Understanding these relationships and discovering the most highly correlated variables allows us to deploy our limited resources more effectively and target the variables that will have the greatest positive impact on improvement.
  • PeteSearch: How to find user information from an email address – FindByEmail code released as open-source. You pass it an email address, and it queries 11 different public APIs to discover what information those services have on the user with that email address.
  • Measuring Measures: Beyond PageRank: Learning with Content and Networks – Conclusion: learning based on content and network data is the current state of the art There is a great paper and talk about personalization in Google News they use content for this purpose, and then user click streams to provide personalization, ie recommend specific articles within each topical cluster. The issue is content filtering is typically (as we say in research) "way harder." Suppose you have a social graph, a bunch of documents, and you know that some users in the social graph like some documents, and you want to recommend other documents that you think they will like. Using approaches based on Networks, you might consider clustering users based on co-visitaion (they have co-liked some of the documents). This scales great, and it internationalizes great. If you start extracting features from the documents themselves, then what you build for English may not work as well for the Chinese market. In addition, there is far more data in the text than there is in the social graph
  • mikemaccana's python-docx at master – GitHub – MIT-licensed Python library to read/write Microsoft Word docx format files. "The docx module reads and writes Microsoft Office Word 2007 docx files. These are referred to as 'WordML', 'Office Open XML' and 'Open XML' by Microsoft. They can be opened in Microsoft Office 2007, Microsoft Mac Office 2008, OpenOffice.org 2.2, and Apple iWork 08. The module was created when I was looking for a Python support for MS Word .doc files, but could only find various hacks involving COM automation, calling .net or Java, or automating OpenOffice or MS Office."

Bookmarks for June 13th through January 16th

These are my links for June 13th through January 16th:

  • StarCraft AI Competition | Expressive Intelligence Studio – AI bot warfare competition using a hacked API to run StarCraft, will be held at AIIDE2010 in October 2010.
    The competition will use StarCraft Brood War 1.16.1. Bots for StarCraft can be developed using the Broodwar API, which provides hooks into StarCraft and enables the development of custom AI for StarCraft. A C++ interface enables developers to query the current state of the game and issue orders to units. An introduction to the Broodwar API is available here. Instructions for building a bot that communicates with a remote process are available here. There is also a Forum. We encourage submission of bots that make use of advanced AI techniques. Some ideas are:
    * Planning
    * Data Mining
    * Machine Learning
    * Case-Based Reasoning
  • Measuring Measures: Learning About Statistical Learning – A "quick start guide" for statistical and machine learning systems, good collection of references.
  • Berkowitz et al : The use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems (2006) – Berkowitz, Steven D., Woodward, Lloyd H., & Woodward, Caitlin. (2006). Use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems. Originally intended for publication in updating the 1988 volume, eds., Wellman and Berkowitz, Social Structures: A Network Approach (Cambridge University Press). Steve died in November, 2003. See Barry Wellman's “Steve Berkowitz: A Network Pioneer has passed away,” in Connections 25(2), 2003. It has not been possible to add the updating of references or of the quality of graphics that might have been possible if Berkowitz were alive. An early version of the article appeared in the Proceedings of the Session on Combating Terrorist Networks: Current Research in Social Network Analysis for the New War Fighting Environment. 8th International Command and Control Research and Technology Symposium. National Defense University, Washington, DC June 17-19, 2003
  • SSH Tunneling through web filters | s-anand.net – Step by step tutorial on using Putty and an EC2 instance to set up a private web proxy on demand.
  • PyDroid GUI automation toolkit – GitHub – What is Pydroid?

    Pydroid is a simple toolkit for automating and scripting repetitive tasks, especially those involving a GUI, with Python. It includes functions for controlling the mouse and keyboard, finding colors and bitmaps on-screen, as well as displaying cross-platform alerts.
    Why use Pydroid?

    * Testing a GUI application for bugs and edge cases
    o You might think your app is stable, but what happens if you press that button 5000 times?
    * Automating games
    o Writing a script to beat that crappy flash game can be so much more gratifying than spending hours playing it yourself.
    * Freaking out friends and family
    o Well maybe this isn't really a practical use, but…

  • Time Series Data Library – More data sets – "This is a collection of about 800 time series drawn from many different fields.Agriculture Chemistry Crime Demography Ecology Finance Health Hydrology Industry Labour Market Macro-Economics Meteorology Micro-Economics Miscellaneous Physics Production Sales Simulated series Sport Transport & Tourism Tree-rings Utilities"
  • How informative is Twitter? » SemanticHacker Blog – "We undertook a small study to characterize the different types of messages that can be found on Twitter. We downloaded a sample of tweets over a two-week period using the Twitter streaming API. This resulted in a corpus of 8.9 million messages (”tweets”) posted by 2.6 million unique users. About 2.7 million of these tweets, or 31%, were replies to a tweet posted by another user, while half a million (6%) were retweets. Almost 2 million (22%) of the messages contained a URL."
  • Gremlin – a Turing-complete, graph-based programming language – GitHub – Gremlin is a Turing-complete, graph-based programming language developed in Java 1.6+ for key/value-pair multi-relational graphs known as property graphs. Gremlin makes extensive use of the XPath 1.0 language to support complex graph traversals. This language has applications in the areas of graph query, analysis, and manipulation. Connectors exist for the following data management systems:

    * TinkerGraph in-memory graph
    * Neo4j graph database
    * Sesame 2.0 compliant RDF stores
    * MongoDB document database

    The documentation for Gremlin can be found at this location. Finally, please visit TinkerPop for other software products.

  • The C Programming Language: 4.10 – by Kernighan & Ritchie & Lovecraft – void Rlyeh
    (int mene[], int wgah, int nagl) {
    int Ia, fhtagn;
    if (wgah>=nagl) return;
    swap (mene,wgah,(wgah+nagl)/2);
    fhtagn = wgah;
    for (Ia=wgah+1; Ia<=nagl; Ia++)
    if (mene[Ia]<mene[wgah])
    swap (mene,++fhtagn,Ia);
    swap (mene,wgah,fhtagn);
    Rlyeh (mene,wgah,fhtagn-1);
    Rlyeh (mene,fhtagn+1,nagl);

    } // PH'NGLUI MGLW'NAFH CTHULHU!

  • How to convert email addresses into name, age, ethnicity, sexual orientation – This is so Meta – "Save your email list as a CSV file (just comma separate those email addresses). Upload this file to your facebook account as if you wanted to add them as friends. Voila, facebook will give you all the profiles of all those users (in my test, about 80% of my email lists have facebook profiles). Now, click through each profile, and because of the new default facebook settings, which makes all information public, about 95% of the user info is available for you to harvest."
  • Microsoft Security Development Lifecycle (SDL): Tools Repository – A collection of previously internal-only security tools from Microsoft, including anti-xss, fuzz test, fxcop, threat modeling, binscope, now available for free download.
  • Analytics X Prize – Home – Forecast the murder rate in Philadelphia – The Analytics X Prize is an ongoing contest to apply analytics, modeling, and statistics to solve the social problems that affect our cities. It combines the fields of statistics, mathematics, and social science to understand the root causes of dysfunction in our neighborhoods. Understanding these relationships and discovering the most highly correlated variables allows us to deploy our limited resources more effectively and target the variables that will have the greatest positive impact on improvement.
  • PeteSearch: How to find user information from an email address – FindByEmail code released as open-source. You pass it an email address, and it queries 11 different public APIs to discover what information those services have on the user with that email address.
  • Measuring Measures: Beyond PageRank: Learning with Content and Networks – Conclusion: learning based on content and network data is the current state of the art There is a great paper and talk about personalization in Google News they use content for this purpose, and then user click streams to provide personalization, ie recommend specific articles within each topical cluster. The issue is content filtering is typically (as we say in research) "way harder." Suppose you have a social graph, a bunch of documents, and you know that some users in the social graph like some documents, and you want to recommend other documents that you think they will like. Using approaches based on Networks, you might consider clustering users based on co-visitaion (they have co-liked some of the documents). This scales great, and it internationalizes great. If you start extracting features from the documents themselves, then what you build for English may not work as well for the Chinese market. In addition, there is far more data in the text than there is in the social graph
  • mikemaccana's python-docx at master – GitHub – MIT-licensed Python library to read/write Microsoft Word docx format files. "The docx module reads and writes Microsoft Office Word 2007 docx files. These are referred to as 'WordML', 'Office Open XML' and 'Open XML' by Microsoft. They can be opened in Microsoft Office 2007, Microsoft Mac Office 2008, OpenOffice.org 2.2, and Apple iWork 08. The module was created when I was looking for a Python support for MS Word .doc files, but could only find various hacks involving COM automation, calling .net or Java, or automating OpenOffice or MS Office."
  • Handy one-liners for SED – Sed expressions are powerful, but somewhat obscure and easy to screw up. A handy cheat sheet for common tasks.

Slide của tôi từ Tìm kiếm Bảng điều chỉnh thời gian thực tại SES Chicago tuần trước

Although real time search is fairly new, as we end 2009, the ability to index and search fresh results is rapidly becoming a commodity, with Bing, various startups, and now Google all integrating status feeds from social networking services. The next set of challenges in 2010 will be around providing better relevance, information discovery, and topic exploration for social search, using signals from the dynamic behavior of users and their interaction with the social and topic graphs.

I gave a short talk on real time and social search for a panel at SES Chicago last week. I've been heads down for the past few months working on Bing Twitter Search, so now that the first launch is out the door it was a nice chance to talk with people about some of the work we're doing. There was a lot of interest in the sentiment, trend, and social graph analysis slides (9 and 10). I will write about those in a separate post, but wanted to get the presentation up for those who have been asking about it.

What's Different about Real Time and Social Search – HJL Slides For SES Chicago Dec 09

What's Different about Real Time and Social Search – HJL Slides For SES Chicago Dec 09 – Presentation Transcript

  1. What's different about real time and social search?
    Hồ John Lee
    Principal Program Manager
    Bing Social Search
    Search Engine Strategies
    Chicago – December 7, 2009
  2. What's Real Time Search Good For, Anyway?
  3. Twitter is Great for Watching Uninformed Panics Unfold Live
    …or finding balloons
    http://xkcd.com/574/
  4. Some characteristics of Twitter / Social media
    Immediacy, Sentiment, Brevity
    Not always accurate
    Feelings, reactions, impressions
    Context is often essential to determine meaning
    Gestural – @user, #hashtag, RT, favorites, follows
    Self-organizing communities of attention and authority
    Content follows attention
    People talk about what others are talking about
    Observations and commentary from everywhere
    Nếu không có nội dung, bạn có thể yêu cầu một số
    Extreme head and tail coverage
    Low relevance “noise” can become “signal” in aggregate
  5. Your product or brand could suddenly be at the center of a huge conversation
    Tiger Woods
    Balloon Boy
    Breaking Story
    Persistent Story
    Big Story
    Bigger Story
  6. Some characteristics of Real time / Social Search
    • Real time and social search is qualitatively different from traditional web search
    • Differences in ranking, relevance, use model
    • Social graph, user behavior, location, event correlation and other input signals
    • Real time search is frequently about discovery, not search per se
    • “what is everyone talking about”, followed by “what are people saying about ”
    • Top real time and social search results will usually differ from top web search results
  7. Bing Twitter Search at a glance
    Top Tweets
    Top Shared Links
    Tweets/Sentiment per link
    Adult /Spam filter; Tweets/Links ranking & relevance
  8. Bing Fall 2009: Twitter vertical, News, MSN, Maps
    MSN Local Edition
    Page 2: Tweets or Links
    Page 1: Tweets & Links
    Twitter Answer on News SERP
    MSN Hot Topics
  9. Topic / sentiment range, volume, trend analysis
    Tỷ lệ cơ sở của đề cập đến / tình cảm mỗi đơn vị thời gian là gì?
    Changes in attention flow around a subject, location, topic
    Bạn cho tín hiệu tương quan từ nhiều nguồn
    Xem xét sự liên quan nguồn và quyền lực cũng
  10. Graph analysis for relevance and ranking
    Chiến dịch thư rác tiếp thị
    Naturally connected community
    Spammy communities are highly visible – don't be part of one!
  11. Bing Twitter Maps Demo
  12. To rise above the noise, there is more to do as search gets more social
    Plus…
  13. Cảm ơn
    Hồ John Lee
    hojohn. lee @ microsoft.com
    twitter.com/hjl
The session was moderated by Barbara Coll , CEO, WebMama.com Inc., with panelists Bill Fischer , Co-Founder & Director, Workdigital, Ltd., Rob Walk , Managing Partner, NovaRising, Nathan Stoll , Co-Founder, Aardvark, and Ho John Lee , Principal Program Manager, Social and Real Time Search, Microsoft Bing.

Slide của tôi từ Tìm kiếm Bảng điều chỉnh thời gian thực tại SES Chicago tuần trước

Although real time search is fairly new, as we end 2009, the ability to index and search fresh results is rapidly becoming a commodity, with Bing, various startups, and now Google all integrating status feeds from social networking services. The next set of challenges in 2010 will be around providing better relevance, information discovery, and topic exploration for social search, using signals from the dynamic behavior of users and their interaction with the social and topic graphs.

I gave a short talk on real time and social search for a panel at SES Chicago last week. I've been heads down for the past few months working on Bing Twitter Search, so now that the first launch is out the door it was a nice chance to talk with people about some of the work we're doing. There was a lot of interest in the sentiment, trend, and social graph analysis slides (9 and 10). I will write about those in a separate post, but wanted to get the presentation up for those who have been asking about it.

What's Different about Real Time and Social Search – HJL Slides For SES Chicago Dec 09

What's Different about Real Time and Social Search – HJL Slides For SES Chicago Dec 09 – Presentation Transcript

  1. What's different about real time and social search?
    Hồ John Lee
    Principal Program Manager
    Bing Social Search
    Search Engine Strategies
    Chicago – December 7, 2009
  2. What's Real Time Search Good For, Anyway?
  3. Twitter is Great for Watching Uninformed Panics Unfold Live
    …or finding balloons
    http://xkcd.com/574/
  4. Some characteristics of Twitter / Social media
    Immediacy, Sentiment, Brevity
    Not always accurate
    Feelings, reactions, impressions
    Context is often essential to determine meaning
    Gestural – @user, #hashtag, RT, favorites, follows
    Self-organizing communities of attention and authority
    Content follows attention
    People talk about what others are talking about
    Observations and commentary from everywhere
    Nếu không có nội dung, bạn có thể yêu cầu một số
    Extreme head and tail coverage
    Low relevance “noise” can become “signal” in aggregate
  5. Your product or brand could suddenly be at the center of a huge conversation
    Tiger Woods
    Balloon Boy
    Breaking Story
    Persistent Story
    Big Story
    Bigger Story
  6. Some characteristics of Real time / Social Search
    • Real time and social search is qualitatively different from traditional web search
    • Differences in ranking, relevance, use model
    • Social graph, user behavior, location, event correlation and other input signals
    • Real time search is frequently about discovery, not search per se
    • “what is everyone talking about”, followed by “what are people saying about ”
    • Top real time and social search results will usually differ from top web search results
  7. Bing Twitter Search at a glance
    Top Tweets
    Top Shared Links
    Tweets/Sentiment per link
    Adult /Spam filter; Tweets/Links ranking & relevance
  8. Bing Fall 2009: Twitter vertical, News, MSN, Maps
    MSN Local Edition
    Page 2: Tweets or Links
    Page 1: Tweets & Links
    Twitter Answer on News SERP
    MSN Hot Topics
  9. Topic / sentiment range, volume, trend analysis
    Tỷ lệ cơ sở của đề cập đến / tình cảm mỗi đơn vị thời gian là gì?
    Changes in attention flow around a subject, location, topic
    Bạn cho tín hiệu tương quan từ nhiều nguồn
    Xem xét sự liên quan nguồn và quyền lực cũng
  10. Graph analysis for relevance and ranking
    Chiến dịch thư rác tiếp thị
    Naturally connected community
    Spammy communities are highly visible – don't be part of one!
  11. Bing Twitter Maps Demo
  12. To rise above the noise, there is more to do as search gets more social
    Plus…
  13. Cảm ơn
    Hồ John Lee
    hojohn. lee @ microsoft.com
    twitter.com/hjl
The session was moderated by Barbara Coll , CEO, WebMama.com Inc., with panelists Bill Fischer , Co-Founder & Director, Workdigital, Ltd., Rob Walk , Managing Partner, NovaRising, Nathan Stoll , Co-Founder, Aardvark, and Ho John Lee , Principal Program Manager, Social and Real Time Search, Microsoft Bing.

Slide của tôi từ Tìm kiếm Bảng điều chỉnh thời gian thực tại SES Chicago tuần trước

Although real time search is fairly new, as we end 2009, the ability to index and search fresh results is rapidly becoming a commodity, with Bing, various startups, and now Google all integrating status feeds from social networking services. The next set of challenges in 2010 will be around providing better relevance, information discovery, and topic exploration for social search, using signals from the dynamic behavior of users and their interaction with the social and topic graphs.

I gave a short talk on real time and social search for a panel at SES Chicago last week. I've been heads down for the past few months working on Bing Twitter Search, so now that the first launch is out the door it was a nice chance to talk with people about some of the work we're doing. There was a lot of interest in the sentiment, trend, and social graph analysis slides (9 and 10). I will write about those in a separate post, but wanted to get the presentation up for those who have been asking about it.

What's Different about Real Time and Social Search – HJL Slides For SES Chicago Dec 09

What's Different about Real Time and Social Search – HJL Slides For SES Chicago Dec 09 – Presentation Transcript

  1. What's different about real time and social search?
    Hồ John Lee
    Principal Program Manager
    Bing Social Search
    Search Engine Strategies
    Chicago – December 7, 2009
  2. What's Real Time Search Good For, Anyway?
  3. Twitter is Great for Watching Uninformed Panics Unfold Live
    …or finding balloons
    http://xkcd.com/574/
  4. Some characteristics of Twitter / Social media
    Immediacy, Sentiment, Brevity
    Not always accurate
    Feelings, reactions, impressions
    Context is often essential to determine meaning
    Gestural – @user, #hashtag, RT, favorites, follows
    Self-organizing communities of attention and authority
    Content follows attention
    People talk about what others are talking about
    Observations and commentary from everywhere
    Nếu không có nội dung, bạn có thể yêu cầu một số
    Extreme head and tail coverage
    Low relevance “noise” can become “signal” in aggregate
  5. Your product or brand could suddenly be at the center of a huge conversation
    Tiger Woods
    Balloon Boy
    Breaking Story
    Persistent Story
    Big Story
    Bigger Story
  6. Some characteristics of Real time / Social Search
    • Real time and social search is qualitatively different from traditional web search
    • Differences in ranking, relevance, use model
    • Social graph, user behavior, location, event correlation and other input signals
    • Real time search is frequently about discovery, not search per se
    • “what is everyone talking about”, followed by “what are people saying about ”
    • Top real time and social search results will usually differ from top web search results
  7. Bing Twitter Search at a glance
    Top Tweets
    Top Shared Links
    Tweets/Sentiment per link
    Adult /Spam filter; Tweets/Links ranking & relevance
  8. Bing Fall 2009: Twitter vertical, News, MSN, Maps
    MSN Local Edition
    Page 2: Tweets or Links
    Page 1: Tweets & Links
    Twitter Answer on News SERP
    MSN Hot Topics
  9. Topic / sentiment range, volume, trend analysis
    Tỷ lệ cơ sở của đề cập đến / tình cảm mỗi đơn vị thời gian là gì?
    Changes in attention flow around a subject, location, topic
    Bạn cho tín hiệu tương quan từ nhiều nguồn
    Xem xét sự liên quan nguồn và quyền lực cũng
  10. Graph analysis for relevance and ranking
    Chiến dịch thư rác tiếp thị
    Naturally connected community
    Spammy communities are highly visible – don't be part of one!
  11. Bing Twitter Maps Demo
  12. To rise above the noise, there is more to do as search gets more social
    Plus…
  13. Cảm ơn
    Hồ John Lee
    hojohn. lee @ microsoft.com
    twitter.com/hjl
The session was moderated by Barbara Coll , CEO, WebMama.com Inc., with panelists Bill Fischer , Co-Founder & Director, Workdigital, Ltd., Rob Walk , Managing Partner, NovaRising, Nathan Stoll , Co-Founder, Aardvark, and Ho John Lee , Principal Program Manager, Social and Real Time Search, Microsoft Bing.

Slide của tôi từ Tìm kiếm Bảng điều chỉnh thời gian thực tại SES Chicago tuần trước

Although real time search is fairly new, as we end 2009, the ability to index and search fresh results is rapidly becoming a commodity, with Bing, various startups, and now Google all integrating status feeds from social networking services. The next set of challenges in 2010 will be around providing better relevance, information discovery, and topic exploration for social search, using signals from the dynamic behavior of users and their interaction with the social and topic graphs.

I gave a short talk on real time and social search for a panel at SES Chicago last week. I've been heads down for the past few months working on Bing Twitter Search, so now that the first launch is out the door it was a nice chance to talk with people about some of the work we're doing. There was a lot of interest in the sentiment, trend, and social graph analysis slides (9 and 10). I will write about those in a separate post, but wanted to get the presentation up for those who have been asking about it.

What's Different about Real Time and Social Search – HJL Slides For SES Chicago Dec 09

What's Different about Real Time and Social Search – HJL Slides For SES Chicago Dec 09 – Presentation Transcript

  1. What's different about real time and social search?
    Hồ John Lee
    Principal Program Manager
    Bing Social Search
    Search Engine Strategies
    Chicago – December 7, 2009
  2. What's Real Time Search Good For, Anyway?
  3. Twitter is Great for Watching Uninformed Panics Unfold Live
    …or finding balloons
    http://xkcd.com/574/
  4. Some characteristics of Twitter / Social media
    Immediacy, Sentiment, Brevity
    Not always accurate
    Feelings, reactions, impressions
    Context is often essential to determine meaning
    Gestural – @user, #hashtag, RT, favorites, follows
    Self-organizing communities of attention and authority
    Content follows attention
    People talk about what others are talking about
    Observations and commentary from everywhere
    Nếu không có nội dung, bạn có thể yêu cầu một số
    Extreme head and tail coverage
    Low relevance “noise” can become “signal” in aggregate
  5. Your product or brand could suddenly be at the center of a huge conversation
    Tiger Woods
    Balloon Boy
    Breaking Story
    Persistent Story
    Big Story
    Bigger Story
  6. Some characteristics of Real time / Social Search
    • Real time and social search is qualitatively different from traditional web search
    • Differences in ranking, relevance, use model
    • Social graph, user behavior, location, event correlation and other input signals
    • Real time search is frequently about discovery, not search per se
    • “what is everyone talking about”, followed by “what are people saying about ”
    • Top real time and social search results will usually differ from top web search results
  7. Bing Twitter Search at a glance
    Top Tweets
    Top Shared Links
    Tweets/Sentiment per link
    Adult /Spam filter; Tweets/Links ranking & relevance
  8. Bing Fall 2009: Twitter vertical, News, MSN, Maps
    MSN Local Edition
    Page 2: Tweets or Links
    Page 1: Tweets & Links
    Twitter Answer on News SERP
    MSN Hot Topics
  9. Topic / sentiment range, volume, trend analysis
    Tỷ lệ cơ sở của đề cập đến / tình cảm mỗi đơn vị thời gian là gì?
    Changes in attention flow around a subject, location, topic
    Bạn cho tín hiệu tương quan từ nhiều nguồn
    Xem xét sự liên quan nguồn và quyền lực cũng
  10. Graph analysis for relevance and ranking
    Chiến dịch thư rác tiếp thị
    Naturally connected community
    Spammy communities are highly visible – don't be part of one!
  11. Bing Twitter Maps Demo
  12. To rise above the noise, there is more to do as search gets more social
    Plus…
  13. Cảm ơn
    Hồ John Lee
    hojohn. lee @ microsoft.com
    twitter.com/hjl
The session was moderated by Barbara Coll , CEO, WebMama.com Inc., with panelists Bill Fischer , Co-Founder & Director, Workdigital, Ltd., Rob Walk , Managing Partner, NovaRising, Nathan Stoll , Co-Founder, Aardvark, and Ho John Lee , Principal Program Manager, Social and Real Time Search, Microsoft Bing.
Page 3 of 78 1 2 3 4 5 ... 10 20 30 ... Last »