Cảnh báo: Thông số 1 để ace_where () dự kiến sẽ là một tài liệu tham khảo, giá trị được đưa ra trong /home/hjlee/hjl/hojohnlee.com/weblog/wp-includes/plugin.php trên đường dây 227

Cảnh báo: Thông số 1 để ace_join () dự kiến sẽ là một tài liệu tham khảo, giá trị được đưa ra trong /home/hjlee/hjl/hojohnlee.com/weblog/wp-includes/plugin.php trên đường dây 227
Blog Hồ John Lee

Bookmarks cho 23 tháng 1 15:00-15:00

Đây là những liên kết của tôi cho 23 tháng 1 15:00-15:00:

  • Data.gov - Các bộ dữ liệu: Mở Cơ quan Chỉ thị của Chính phủ - bộ dữ liệu theo yêu cầu của Open Chỉ thị của Chính phủ thông qua vào cuối ngày, ngày 22 tháng 1, năm 2010. Đạo luật Tự do Thông tin theo yêu cầu bản ghi, Kho bạc TARP và hoạt động phái sinh nhật ký, tội phạm, thu nhập, nông nghiệp bộ dữ liệu.

Đánh dấu cho ngày 20 tháng 1 thông qua ngày 23 tháng 1

Đây là những liên kết của tôi cho ngày 20 tháng 1 thông qua ngày 23 tháng 1:

  • Data.gov - Các bộ dữ liệu: Mở Cơ quan Chỉ thị của Chính phủ - bộ dữ liệu theo yêu cầu của Open Chỉ thị của Chính phủ thông qua vào cuối ngày, ngày 22 tháng 1, năm 2010. Đạo luật Tự do Thông tin theo yêu cầu bản ghi, Kho bạc TARP và hoạt động phái sinh nhật ký, tội phạm, thu nhập, nông nghiệp bộ dữ liệu.
  • Tất cả các nhu cầu Twitter Bot của bạn là tình yêu - tên của bot? Jason Thorton. Ông đã cùng ồn ào trong nhiều tháng nay, gửi ra trên 1.250 tweets một số 174 người theo dõi. Tweets của mình, trong khi không đặc biệt sáng tạo, quản lý được cả hai đáng tin cậy và kịp thời. Và anh ấy được hỗ trợ bởi một từ duy nhất: Tình yêu.

    Thorton là sự sáng tạo của nhà phát triển Ryan Merket, những người xây dựng nó như một dự án bên trong khoảng ba giờ. Merket vừa đăng các mã mà quyền hạn mình, và cũng đã tiết lộ cách ông đã Thorton có vẻ hơi thực tế: các bot tìm kiếm tweets với từ "tình yêu" trong họ và tweets họ như là của riêng của nó.

  • Xây dựng một Bot Twitter -.. "Gặp gỡ Jason Thorton Để những người biết Jason, ông là một doanh nhân thành đạt ở San Francisco, người tweets 4-5 lần một ngày Nhưng Jason có một bí mật, anh ấy không thực sự là một con người, ông là sản phẩm của tôi thuật toán đơn giản trong PHP

    Jason tweets A LOT về từ "tình yêu" - đó là bởi vì Jason thực sự đánh cắp tweets từ thanh thời gian công cộng có chứa từ "tình yêu" và đăng tải chúng như là của riêng mình

    Jason cũngreplies cho những người sử dụng từ "tình yêu" trong tweets của họ, và hỏi họ những câu hỏi ngẫu nhiên hoặc nói điều gì đó tùy ý

    Tôi mất khoảng 3 giờ để mã Jason, hãy tưởng tượng những gì một kỹ sư thực sự có thể làm với các thuật toán AI thực? Bây giờ nhận ra rằng nó đã là một thực tế. Các trang web như Twitter có đầy đủ các dự án phụ, các sáng kiến ​​công ty, spam bots, và robot AI. Khi dòng chảy tự do của thông tin trở nên cởi mở, số lượng tin sai tăng lên. Theres một nhu cầu thực sự cho một người nào đó để bác sĩ thú y người dân chúng tôi 'đáp ứng' trên các trang web xã hội - sẽ được thú vị để xem làm thế nào thị trường này phát triển trong năm tới

  • Tình trạng giám sát Website - API công cộng Status - màn hình y tế cho 26 API từ các dịch vụ web phổ biến, bao gồm Google Search, Google Maps, Bing, Facebook, Twitter, SalesForce, YouTube, Amazon, eBay và những người khác
  • PG & E hệ thống điện Cúp Bản đồ - bản đồ này cho thấy sự mất hiện tại trong khu vực dịch vụ 70.000 dặm vuông của chúng tôi. Để xem chi tiết về một cúp, bao gồm cả nguyên nhân và thời gian dự kiến ​​phục hồi, click vào biểu tượng mã màu kết hợp với cúp đó.

Đánh dấu cho ngày 20 tháng 1 thông qua ngày 22 tháng một

Đây là những liên kết của tôi cho ngày 20 tháng 1 thông qua 22 tháng 1:

  • Tất cả các nhu cầu Twitter Bot của bạn là tình yêu - tên của bot? Jason Thorton. Ông đã cùng ồn ào trong nhiều tháng nay, gửi ra trên 1.250 tweets một số 174 người theo dõi. Tweets của mình, trong khi không đặc biệt sáng tạo, quản lý được cả hai đáng tin cậy và kịp thời. Và anh ấy được hỗ trợ bởi một từ duy nhất: Tình yêu.

    Thorton là sự sáng tạo của nhà phát triển Ryan Merket, những người xây dựng nó như một dự án bên trong khoảng ba giờ. Merket vừa đăng các mã mà quyền hạn mình, và cũng đã tiết lộ cách ông đã Thorton có vẻ hơi thực tế: các bot tìm kiếm tweets với từ "tình yêu" trong họ và tweets họ như là của riêng của nó.

  • Xây dựng một Bot Twitter -.. "Gặp gỡ Jason Thorton Để những người biết Jason, ông là một doanh nhân thành đạt ở San Francisco, người tweets 4-5 lần một ngày Nhưng Jason có một bí mật, anh ấy không thực sự là một con người, ông là sản phẩm của tôi thuật toán đơn giản trong PHP

    Jason tweets A LOT về từ "tình yêu" - đó là bởi vì Jason thực sự đánh cắp tweets từ thanh thời gian công cộng có chứa từ "tình yêu" và đăng tải chúng như là của riêng mình

    Jason cũngreplies cho những người sử dụng từ "tình yêu" trong tweets của họ, và hỏi họ những câu hỏi ngẫu nhiên hoặc nói điều gì đó tùy ý

    Tôi mất khoảng 3 giờ để mã Jason, hãy tưởng tượng những gì một kỹ sư thực sự có thể làm với các thuật toán AI thực? Bây giờ nhận ra rằng nó đã là một thực tế. Các trang web như Twitter có đầy đủ các dự án phụ, các sáng kiến ​​công ty, spam bots, và robot AI. Khi dòng chảy tự do của thông tin trở nên cởi mở, số lượng tin sai tăng lên. Theres một nhu cầu thực sự cho một người nào đó để bác sĩ thú y người dân chúng tôi 'đáp ứng' trên các trang web xã hội - sẽ được thú vị để xem làm thế nào thị trường này phát triển trong năm tới

  • Tình trạng giám sát Website - API công cộng Status - màn hình y tế cho 26 API từ các dịch vụ web phổ biến, bao gồm Google Search, Google Maps, Bing, Facebook, Twitter, SalesForce, YouTube, Amazon, eBay và những người khác
  • PG & E hệ thống điện Cúp Bản đồ - bản đồ này cho thấy sự mất hiện tại trong khu vực dịch vụ 70.000 dặm vuông của chúng tôi. Để xem chi tiết về một cúp, bao gồm cả nguyên nhân và thời gian dự kiến ​​phục hồi, click vào biểu tượng mã màu kết hợp với cúp đó.

Đánh dấu cho ngày 20 tháng 1 10:26-14:12

Đây là những liên kết của tôi cho ngày 20 tháng 1 10:26-14:12:

  • Tình trạng giám sát Website - API công cộng Status - màn hình y tế cho 26 API từ các dịch vụ web phổ biến, bao gồm Google Search, Google Maps, Bing, Facebook, Twitter, SalesForce, YouTube, Amazon, eBay và những người khác
  • PG & E hệ thống điện Cúp Bản đồ - bản đồ này cho thấy sự mất hiện tại trong khu vực dịch vụ 70.000 dặm vuông của chúng tôi. Để xem chi tiết về một cúp, bao gồm cả nguyên nhân và thời gian dự kiến ​​phục hồi, click vào biểu tượng mã màu kết hợp với cúp đó.

Đánh dấu cho ngày 20 tháng 1 10:26-10:26

Đây là những liên kết của tôi cho ngày 20 tháng 1 10:26-10:26:

  • PG & E hệ thống điện Cúp Bản đồ - bản đồ này cho thấy sự mất hiện tại trong khu vực dịch vụ 70.000 dặm vuông của chúng tôi. Để xem chi tiết về một cúp, bao gồm cả nguyên nhân và thời gian dự kiến ​​phục hồi, click vào biểu tượng mã màu kết hợp với cúp đó.

Đánh dấu cho ngày 17 tháng 1 thông qua ngày 20 tháng 1

Đây là những liên kết của tôi cho ngày 17 tháng 1 thông qua ngày 20 tháng 1:

  • PG & E hệ thống điện Cúp Bản đồ - bản đồ này cho thấy sự mất hiện tại trong khu vực dịch vụ 70.000 dặm vuông của chúng tôi. Để xem chi tiết về một cúp, bao gồm cả nguyên nhân và thời gian dự kiến ​​phục hồi, click vào biểu tượng mã màu kết hợp với cúp đó.
  • Twitter.com vs Twitter hệ sinh thái - Fred Wilson bình luận về một số dữ liệu từ John Borthwick cho thấy Twitter sử dụng hệ sinh thái = 3-5x Twitter.com trực tiếp.

    "Biểu đồ của John ước tính Twitter.com là khoảng 20mm UV một tháng ở Mỹ (comScore có nó ở 60mm UV trên toàn thế giới) và các hệ sinh thái Twitter vào khoảng 60mm UV ở Mỹ.

    Điều đó nói rằng trên tất cả các dịch vụ web, không chỉ AVC, các hệ sinh thái Twitter là về 3x Twitter.com. Và trên blog này, có khán giả chắc chắn là người sử dụng điện, tỷ lệ đó là 5x. "

  • Chris Walshaw :: Lưu Trữ :: Nghiên cứu phân vùng - Chào mừng đến với Đại học Greenwich Biểu đồ phân vùng lưu trữ. Các kho lưu trữ bao gồm các phân vùng tốt nhất tìm thấy cho đến nay cho một loạt các biểu đồ và mục đích của nó là cung cấp một tiêu chuẩn, dựa vào đó các thuật toán phân vùng có thể được thử nghiệm, và một nguồn tài nguyên để thử nghiệm.

    Các kho lưu trữ phân vùng đã hoạt động từ năm 2000 và bao gồm kết quả từ hầu hết các gói phần mềm phân vùng đồ thị lớn. Các nhà nghiên cứu phát triển thuật toán phân vùng thử nghiệm thường xuyên trình phân vùng mới để đưa vào có thể.

    Hầu hết các đồ thị kiểm tra phát sinh từ các ứng dụng phân vùng điển hình, mặc dù các kho lưu trữ cũng bao gồm các kết quả tính toán cho một bộ kiểm tra đồ thị màu [Wal04] chứa trong một phụ lục riêng.

    Các kho lưu trữ ban đầu được thiết lập như là một phần của một dự án nghiên cứu phân vùng chất lượng rất cao và tác giả có nhu cầu tham khảo các phân vùng lưu trữ nên trích dẫn bài báo [SWC04].

  • Thu thập thông tin «The Guy của Twitter sản phẩm - "Danh sách các sự cố ảnh hưởng đến thời gian tải trang của các sản phẩm Twitter, phân biệt giữa tổng số thời gian chết, và một phần thời gian chết và không thể tiếp cận thông tin, dựa trên các bài đăng công khai trên blog Twitter.

    http://status.twitter.com/archive

    Tôi đã làm hết sức mình để không tăng gấp đôi tính bất kỳ vấn đề, nhưng rất khó vì nhiều vấn đề xảy ra rất thường xuyên, và nó thường rất khó để phân biệt, từ các bài đăng trên blog tình trạng một mình, giữa một vấn đề sự bền bỉ được kinh nghiệm hoặc cố định, từ đó của một sự xuất hiện mới của một vấn đề tương tự hoặc giống nhau. Hơn nữa, tôi cũng loại trừ các tác động trên Thời gian tải trang phát sinh từ kế hoạch bảo trì / ngưng hoạt động - khoảng thời gian mà qua đó kỳ vọng người dùng sẽ được liên kết với hầu hết các lời hứa của sản phẩm của Thời gian tải trang. "

  • Soundboard.com - Soundboard.com là danh mục lớn nhất của web của âm thanh miễn phí và soundboards - trong hơn 20 loại, cho điện thoại di động hoặc máy tính. 252.858 âm thanh miễn phí trên 17.171 soundboards từ phim ảnh đến thể thao, hiệu ứng âm thanh, truyền hình, người nổi tiếng, lịch sử và du lịch. Hoặc xây dựng, tùy chỉnh, nhúng và quản lý của riêng bạn

Đánh dấu cho ngày 17 tháng 1 thông qua ngày 20 tháng 1

Đây là những liên kết của tôi cho ngày 17 tháng 1 thông qua ngày 20 tháng 1:

  • PG & E hệ thống điện Cúp Bản đồ - bản đồ này cho thấy sự mất hiện tại trong khu vực dịch vụ 70.000 dặm vuông của chúng tôi. Để xem chi tiết về một cúp, bao gồm cả nguyên nhân và thời gian dự kiến ​​phục hồi, click vào biểu tượng mã màu kết hợp với cúp đó.
  • Twitter.com vs Twitter hệ sinh thái - Fred Wilson bình luận về một số dữ liệu từ John Borthwick cho thấy Twitter sử dụng hệ sinh thái = 3-5x Twitter.com trực tiếp.

    "Biểu đồ của John ước tính Twitter.com là khoảng 20mm UV một tháng ở Mỹ (comScore có nó ở 60mm UV trên toàn thế giới) và các hệ sinh thái Twitter vào khoảng 60mm UV ở Mỹ.

    Điều đó nói rằng trên tất cả các dịch vụ web, không chỉ AVC, các hệ sinh thái Twitter là về 3x Twitter.com. Và trên blog này, có khán giả chắc chắn là người sử dụng điện, tỷ lệ đó là 5x. "

  • Chris Walshaw :: Lưu Trữ :: Nghiên cứu phân vùng - Chào mừng đến với Đại học Greenwich Biểu đồ phân vùng lưu trữ. Các kho lưu trữ bao gồm các phân vùng tốt nhất tìm thấy cho đến nay cho một loạt các biểu đồ và mục đích của nó là cung cấp một tiêu chuẩn, dựa vào đó các thuật toán phân vùng có thể được thử nghiệm, và một nguồn tài nguyên để thử nghiệm.

    Các kho lưu trữ phân vùng đã hoạt động từ năm 2000 và bao gồm kết quả từ hầu hết các gói phần mềm phân vùng đồ thị lớn. Các nhà nghiên cứu phát triển thuật toán phân vùng thử nghiệm thường xuyên trình phân vùng mới để đưa vào có thể.

    Hầu hết các đồ thị kiểm tra phát sinh từ các ứng dụng phân vùng điển hình, mặc dù các kho lưu trữ cũng bao gồm các kết quả tính toán cho một bộ kiểm tra đồ thị màu [Wal04] chứa trong một phụ lục riêng.

    Các kho lưu trữ ban đầu được thiết lập như là một phần của một dự án nghiên cứu phân vùng chất lượng rất cao và tác giả có nhu cầu tham khảo các phân vùng lưu trữ nên trích dẫn bài báo [SWC04].

  • Thu thập thông tin «The Guy của Twitter sản phẩm - "Danh sách các sự cố ảnh hưởng đến thời gian tải trang của các sản phẩm Twitter, phân biệt giữa tổng số thời gian chết, và một phần thời gian chết và không thể tiếp cận thông tin, dựa trên các bài đăng công khai trên blog Twitter.

    http://status.twitter.com/archive

    Tôi đã làm hết sức mình để không tăng gấp đôi tính bất kỳ vấn đề, nhưng rất khó vì nhiều vấn đề xảy ra rất thường xuyên, và nó thường rất khó để phân biệt, từ các bài đăng trên blog tình trạng một mình, giữa một vấn đề sự bền bỉ được kinh nghiệm hoặc cố định, từ đó của một sự xuất hiện mới của một vấn đề tương tự hoặc giống nhau. Hơn nữa, tôi cũng loại trừ các tác động trên Thời gian tải trang phát sinh từ kế hoạch bảo trì / ngưng hoạt động - khoảng thời gian mà qua đó kỳ vọng người dùng sẽ được liên kết với hầu hết các lời hứa của sản phẩm của Thời gian tải trang. "

  • Soundboard.com - Soundboard.com là danh mục lớn nhất của web của âm thanh miễn phí và soundboards - trong hơn 20 loại, cho điện thoại di động hoặc máy tính. 252.858 âm thanh miễn phí trên 17.171 soundboards từ phim ảnh đến thể thao, hiệu ứng âm thanh, truyền hình, người nổi tiếng, lịch sử và du lịch. Hoặc xây dựng, tùy chỉnh, nhúng và quản lý của riêng bạn

Đánh dấu cho ngày 17 tháng 1 thông qua ngày 18 tháng 1

Đây là những liên kết của tôi cho ngày 17 tháng 1 thông qua ngày 18 tháng 1:

  • Twitter.com vs Twitter hệ sinh thái - Fred Wilson bình luận về một số dữ liệu từ John Borthwick cho thấy Twitter sử dụng hệ sinh thái = 3-5x Twitter.com trực tiếp.

    "Biểu đồ của John ước tính Twitter.com là khoảng 20mm UV một tháng ở Mỹ (comScore có nó ở 60mm UV trên toàn thế giới) và các hệ sinh thái Twitter vào khoảng 60mm UV ở Mỹ.

    Điều đó nói rằng trên tất cả các dịch vụ web, không chỉ AVC, các hệ sinh thái Twitter là về 3x Twitter.com. Và trên blog này, có khán giả chắc chắn là người sử dụng điện, tỷ lệ đó là 5x. "

  • Chris Walshaw :: Lưu Trữ :: Nghiên cứu phân vùng - Chào mừng đến với Đại học Greenwich Biểu đồ phân vùng lưu trữ. Các kho lưu trữ bao gồm các phân vùng tốt nhất tìm thấy cho đến nay cho một loạt các biểu đồ và mục đích của nó là cung cấp một tiêu chuẩn, dựa vào đó các thuật toán phân vùng có thể được thử nghiệm, và một nguồn tài nguyên để thử nghiệm.

    Các kho lưu trữ phân vùng đã hoạt động từ năm 2000 và bao gồm kết quả từ hầu hết các gói phần mềm phân vùng đồ thị lớn. Các nhà nghiên cứu phát triển thuật toán phân vùng thử nghiệm thường xuyên trình phân vùng mới để đưa vào có thể.

    Hầu hết các đồ thị kiểm tra phát sinh từ các ứng dụng phân vùng điển hình, mặc dù các kho lưu trữ cũng bao gồm các kết quả tính toán cho một bộ kiểm tra đồ thị màu [Wal04] chứa trong một phụ lục riêng.

    Các kho lưu trữ ban đầu được thiết lập như là một phần của một dự án nghiên cứu phân vùng chất lượng rất cao và tác giả có nhu cầu tham khảo các phân vùng lưu trữ nên trích dẫn bài báo [SWC04].

  • Thu thập thông tin «The Guy của Twitter sản phẩm - "Danh sách các sự cố ảnh hưởng đến thời gian tải trang của các sản phẩm Twitter, phân biệt giữa tổng số thời gian chết, và một phần thời gian chết và không thể tiếp cận thông tin, dựa trên các bài đăng công khai trên blog Twitter.

    http://status.twitter.com/archive

    Tôi đã làm hết sức mình để không tăng gấp đôi tính bất kỳ vấn đề, nhưng rất khó vì nhiều vấn đề xảy ra rất thường xuyên, và nó thường rất khó để phân biệt, từ các bài đăng trên blog tình trạng một mình, giữa một vấn đề sự bền bỉ được kinh nghiệm hoặc cố định, từ đó của một sự xuất hiện mới của một vấn đề tương tự hoặc giống nhau. Hơn nữa, tôi cũng loại trừ các tác động trên Thời gian tải trang phát sinh từ kế hoạch bảo trì / ngưng hoạt động - khoảng thời gian mà qua đó kỳ vọng người dùng sẽ được liên kết với hầu hết các lời hứa của sản phẩm của Thời gian tải trang. "

  • Soundboard.com - Soundboard.com là danh mục lớn nhất của web của âm thanh miễn phí và soundboards - trong hơn 20 loại, cho điện thoại di động hoặc máy tính. 252.858 âm thanh miễn phí trên 17.171 soundboards từ phim ảnh đến thể thao, hiệu ứng âm thanh, truyền hình, người nổi tiếng, lịch sử và du lịch. Hoặc xây dựng, tùy chỉnh, nhúng và quản lý của riêng bạn

Đánh dấu cho ngày 17 tháng 1 thông qua ngày 18 tháng 1

Đây là những liên kết của tôi cho ngày 17 tháng 1 thông qua ngày 18 tháng 1:

  • Twitter.com vs Twitter hệ sinh thái - Fred Wilson bình luận về một số dữ liệu từ John Borthwick cho thấy Twitter sử dụng hệ sinh thái = 3-5x Twitter.com trực tiếp.

    "Biểu đồ của John ước tính Twitter.com là khoảng 20mm UV một tháng ở Mỹ (comScore có nó ở 60mm UV trên toàn thế giới) và các hệ sinh thái Twitter vào khoảng 60mm UV ở Mỹ.

    Điều đó nói rằng trên tất cả các dịch vụ web, không chỉ AVC, các hệ sinh thái Twitter là về 3x Twitter.com. Và trên blog này, có khán giả chắc chắn là người sử dụng điện, tỷ lệ đó là 5x. "

  • Chris Walshaw :: Lưu Trữ :: Nghiên cứu phân vùng - Chào mừng đến với Đại học Greenwich Biểu đồ phân vùng lưu trữ. Các kho lưu trữ bao gồm các phân vùng tốt nhất tìm thấy cho đến nay cho một loạt các biểu đồ và mục đích của nó là cung cấp một tiêu chuẩn, dựa vào đó các thuật toán phân vùng có thể được thử nghiệm, và một nguồn tài nguyên để thử nghiệm.

    Các kho lưu trữ phân vùng đã hoạt động từ năm 2000 và bao gồm kết quả từ hầu hết các gói phần mềm phân vùng đồ thị lớn. Các nhà nghiên cứu phát triển thuật toán phân vùng thử nghiệm thường xuyên trình phân vùng mới để đưa vào có thể.

    Hầu hết các đồ thị kiểm tra phát sinh từ các ứng dụng phân vùng điển hình, mặc dù các kho lưu trữ cũng bao gồm các kết quả tính toán cho một bộ kiểm tra đồ thị màu [Wal04] chứa trong một phụ lục riêng.

    Các kho lưu trữ ban đầu được thiết lập như là một phần của một dự án nghiên cứu phân vùng chất lượng rất cao và tác giả có nhu cầu tham khảo các phân vùng lưu trữ nên trích dẫn bài báo [SWC04].

  • Thu thập thông tin «The Guy của Twitter sản phẩm - "Danh sách các sự cố ảnh hưởng đến thời gian tải trang của các sản phẩm Twitter, phân biệt giữa tổng số thời gian chết, và một phần thời gian chết và không thể tiếp cận thông tin, dựa trên các bài đăng công khai trên blog Twitter.

    http://status.twitter.com/archive

    Tôi đã làm hết sức mình để không tăng gấp đôi tính bất kỳ vấn đề, nhưng rất khó vì nhiều vấn đề xảy ra rất thường xuyên, và nó thường rất khó để phân biệt, từ các bài đăng trên blog tình trạng một mình, giữa một vấn đề sự bền bỉ được kinh nghiệm hoặc cố định, từ đó của một sự xuất hiện mới của một vấn đề tương tự hoặc giống nhau. Hơn nữa, tôi cũng loại trừ các tác động trên Thời gian tải trang phát sinh từ kế hoạch bảo trì / ngưng hoạt động - khoảng thời gian mà qua đó kỳ vọng người dùng sẽ được liên kết với hầu hết các lời hứa của sản phẩm của Thời gian tải trang. "

  • Soundboard.com - Soundboard.com là danh mục lớn nhất của web của âm thanh miễn phí và soundboards - trong hơn 20 loại, cho điện thoại di động hoặc máy tính. 252.858 âm thanh miễn phí trên 17.171 soundboards từ phim ảnh đến thể thao, hiệu ứng âm thanh, truyền hình, người nổi tiếng, lịch sử và du lịch. Hoặc xây dựng, tùy chỉnh, nhúng và quản lý của riêng bạn

Đánh dấu cho ngày 17 tháng 1 thông qua ngày 18 tháng 1

Đây là những liên kết của tôi cho ngày 17 tháng 1 thông qua ngày 18 tháng 1:

  • Twitter.com vs Twitter hệ sinh thái - Fred Wilson bình luận về một số dữ liệu từ John Borthwick cho thấy Twitter sử dụng hệ sinh thái = 3-5x Twitter.com trực tiếp.

    "Biểu đồ của John ước tính Twitter.com là khoảng 20mm UV một tháng ở Mỹ (comScore có nó ở 60mm UV trên toàn thế giới) và các hệ sinh thái Twitter vào khoảng 60mm UV ở Mỹ.

    Điều đó nói rằng trên tất cả các dịch vụ web, không chỉ AVC, các hệ sinh thái Twitter là về 3x Twitter.com. Và trên blog này, có khán giả chắc chắn là người sử dụng điện, tỷ lệ đó là 5x. "

  • Chris Walshaw :: Lưu Trữ :: Nghiên cứu phân vùng - Chào mừng đến với Đại học Greenwich Biểu đồ phân vùng lưu trữ. Các kho lưu trữ bao gồm các phân vùng tốt nhất tìm thấy cho đến nay cho một loạt các biểu đồ và mục đích của nó là cung cấp một tiêu chuẩn, dựa vào đó các thuật toán phân vùng có thể được thử nghiệm, và một nguồn tài nguyên để thử nghiệm.

    Các kho lưu trữ phân vùng đã hoạt động từ năm 2000 và bao gồm kết quả từ hầu hết các gói phần mềm phân vùng đồ thị lớn. Các nhà nghiên cứu phát triển thuật toán phân vùng thử nghiệm thường xuyên trình phân vùng mới để đưa vào có thể.

    Hầu hết các đồ thị kiểm tra phát sinh từ các ứng dụng phân vùng điển hình, mặc dù các kho lưu trữ cũng bao gồm các kết quả tính toán cho một bộ kiểm tra đồ thị màu [Wal04] chứa trong một phụ lục riêng.

    Các kho lưu trữ ban đầu được thiết lập như là một phần của một dự án nghiên cứu phân vùng chất lượng rất cao và tác giả có nhu cầu tham khảo các phân vùng lưu trữ nên trích dẫn bài báo [SWC04].

  • Thu thập thông tin «The Guy của Twitter sản phẩm - "Danh sách các sự cố ảnh hưởng đến thời gian tải trang của các sản phẩm Twitter, phân biệt giữa tổng số thời gian chết, và một phần thời gian chết và không thể tiếp cận thông tin, dựa trên các bài đăng công khai trên blog Twitter.

    http://status.twitter.com/archive

    Tôi đã làm hết sức mình để không tăng gấp đôi tính bất kỳ vấn đề, nhưng rất khó vì nhiều vấn đề xảy ra rất thường xuyên, và nó thường rất khó để phân biệt, từ các bài đăng trên blog tình trạng một mình, giữa một vấn đề sự bền bỉ được kinh nghiệm hoặc cố định, từ đó của một sự xuất hiện mới của một vấn đề tương tự hoặc giống nhau. Hơn nữa, tôi cũng loại trừ các tác động trên Thời gian tải trang phát sinh từ kế hoạch bảo trì / ngưng hoạt động - khoảng thời gian mà qua đó kỳ vọng người dùng sẽ được liên kết với hầu hết các lời hứa của sản phẩm của Thời gian tải trang. "

  • Soundboard.com - Soundboard.com là danh mục lớn nhất của web của âm thanh miễn phí và soundboards - trong hơn 20 loại, cho điện thoại di động hoặc máy tính. 252.858 âm thanh miễn phí trên 17.171 soundboards từ phim ảnh đến thể thao, hiệu ứng âm thanh, truyền hình, người nổi tiếng, lịch sử và du lịch. Hoặc xây dựng, tùy chỉnh, nhúng và quản lý của riêng bạn

Đánh dấu cho ngày 17 tháng 1 21:37-21:53

Đây là những liên kết của tôi cho ngày 17 tháng 1 21:37-21:53:

  • Thu thập thông tin «The Guy của Twitter sản phẩm - "Danh sách các sự cố ảnh hưởng đến thời gian tải trang của các sản phẩm Twitter, phân biệt giữa tổng số thời gian chết, và một phần thời gian chết và không thể tiếp cận thông tin, dựa trên các bài đăng công khai trên blog Twitter.

    http://status.twitter.com/archive

    Tôi đã làm hết sức mình để không tăng gấp đôi tính bất kỳ vấn đề, nhưng rất khó vì nhiều vấn đề xảy ra rất thường xuyên, và nó thường rất khó để phân biệt, từ các bài đăng trên blog tình trạng một mình, giữa một vấn đề sự bền bỉ được kinh nghiệm hoặc cố định, từ đó của một sự xuất hiện mới của một vấn đề tương tự hoặc giống nhau. Hơn nữa, tôi cũng loại trừ các tác động trên Thời gian tải trang phát sinh từ kế hoạch bảo trì / ngưng hoạt động - khoảng thời gian mà qua đó kỳ vọng người dùng sẽ được liên kết với hầu hết các lời hứa của sản phẩm của Thời gian tải trang. "

  • Soundboard.com - Soundboard.com là danh mục lớn nhất của web của âm thanh miễn phí và soundboards - trong hơn 20 loại, cho điện thoại di động hoặc máy tính. 252.858 âm thanh miễn phí trên 17.171 soundboards từ phim ảnh đến thể thao, hiệu ứng âm thanh, truyền hình, người nổi tiếng, lịch sử và du lịch. Hoặc xây dựng, tùy chỉnh, nhúng và quản lý của riêng bạn

Bookmarks cho 31 tháng 12 thông qua ngày 17 tháng một

Đây là những liên kết của tôi cho ngày 31 tháng 12 thông qua ngày 17 tháng một:

  • Khan Academy - Học viện Khan là một tổ chức phi lợi nhuận với nhiệm vụ cung cấp một nền giáo dục chất lượng cao cho bất cứ ai, bất cứ nơi nào.

    Chúng tôi có 1000 + video trên YouTube bao gồm tất cả mọi thứ từ số học cơ bản và đại số để phương trình vi phân, vật lý, hóa học, sinh học và tài chính đã được ghi nhận bởi Salman Khan.

  • AI cạnh tranh StarCraft | biểu cảm Intelligence Studio - AI cạnh tranh chiến tranh bot sử dụng một API hack để chạy StarCraft, sẽ được tổ chức tại AIIDE2010 trong tháng 10 năm 2010.
    Sự cạnh tranh sẽ sử dụng StarCraft Brood War 1.16.1. Bots cho StarCraft có thể được phát triển bằng cách sử dụng API Broodwar, cung cấp móc vào StarCraft và cho phép sự phát triển của các tùy chỉnh AI cho StarCraft. Một giao diện C ++ cho phép các nhà phát triển để truy vấn trạng thái hiện tại của trò chơi và vấn đề đơn đặt hàng cho các đơn vị. Giới thiệu về các API Broodwar có sẵn ở đây. Hướng dẫn xây dựng một bot giao tiếp với một quá trình từ xa có sẵn ở đây. Ngoài ra còn có một diễn đàn. Chúng tôi khuyến khích nộp hồ sơ của chương trình mà sử dụng các kỹ thuật tiên tiến AI. Một số ý tưởng là:
    * Kế hoạch
    * Khai thác dữ liệu
    * Máy học
    * Case-Based Reasoning
  • Các biện pháp đo: Tìm hiểu về học thống kê - Một "hướng dẫn nhanh" cho các hệ thống học tập thống kê và máy móc, bộ sưu tập tốt của tài liệu tham khảo.
  • Berkowitz et al: Việc sử dụng các phương pháp chính thức để lập bản đồ, phân tích và giải thích hawala và hệ thống chuyển tiền thay thế khủng bố liên quan đến (2006) - Berkowitz, Steven D., Woodward, Lloyd H., & Woodward, Caitlin. (2006). Sử dụng phương pháp chính thức để lập bản đồ, phân tích và giải thích hawala và hệ thống chuyển tiền thay thế liên quan đến khủng bố. Ban đầu dự định cho xuất bản trong việc cập nhật khối lượng năm 1988, eds, Wellman và Berkowitz, cấu trúc xã hội:. Phương pháp tiếp cận mạng (Cambridge University Press). Steve qua đời vào tháng Mười, năm 2003. Xem Barry Wellman của "Steve Berkowitz: Một người tiên phong Network đã qua đời," trong Connections 25 (2), năm 2003. Nó đã không thể thêm việc cập nhật tài liệu tham khảo hoặc về chất lượng đồ họa mà có thể có được, nếu Berkowitz còn sống. Một phiên bản của bài viết xuất hiện trong Kỷ yếu của kỳ họp về chống khủng bố Networks: Nghiên cứu hiện tại trong xã hội Phân tích mạng cho các chiến đấu Môi trường Chiến tranh mới. 8 chỉ huy quốc tế và nghiên cứu kiểm soát và Công nghệ Hội nghị chuyên đề. Đại học Quốc phòng Quốc gia, Washington, DC ngày 17-ngày 19 Tháng Sáu, 2003
  • SSH Tunneling thông qua các bộ lọc web | s-anand.net - Từng bước hướng dẫn về sử dụng Putty và một thể EC2 để thiết lập một proxy web riêng theo yêu cầu.
  • PyDroid GUI bộ công cụ tự động hóa - GitHub - Pydroid là gì?

    Pydroid là một bộ công cụ đơn giản để tự động hoá và kịch bản lặp đi lặp lại, đặc biệt là liên quan đến một giao diện đồ họa, với Python. Nó bao gồm các chức năng để kiểm soát chuột và bàn phím, tìm kiếm màu sắc và bitmap trên màn hình, cũng như hiển thị cảnh báo cross-platform.
    Tại sao sử dụng Pydroid?

    * Thử nghiệm một ứng dụng giao diện đồ họa cho các lỗi và các trường hợp cạnh
    o Bạn có thể nghĩ rằng ứng dụng của bạn là ổn định, nhưng những gì xảy ra nếu bạn bấm nút 5000 lần?
    * Trò chơi Tự động hoá
    o Viết một kịch bản để đánh bại rằng trò chơi flash crappy có thể còn nhiều hơn nữa hài lòng hơn so với chi tiêu giờ chơi nó cho mình.
    * Freaking ra bạn bè và gia đình
    o Cũng có thể đây không phải là thực sự là một thực tế sử dụng, nhưng ...

  • Thời Gian Thư Viện Data Series - Nhiều bộ dữ liệu - "Đây là một bộ sưu tập khoảng 800 lần loạt rút ra từ nhiều khác nhau fields.Agriculture Hóa học tội phạm Nhân khẩu học Sinh thái Tài chính Y tế Công nghiệp Thủy văn thị trường lao động vĩ mô Kinh tế Khí tượng Micro-Kinh tế Miscellaneous Vật lý Sản xuất Bán hàng mô phỏng loạt Sport Vận tải & Du lịch Tree-nhẫn Utilities "
  • Làm thế nào thông tin là Twitter? »SemanticHacker Blog -.. "Chúng tôi đã tiến hành một nghiên cứu nhỏ để mô tả các loại thông tin khác nhau có thể được tìm thấy trên Twitter Chúng tôi đã tải về một mẫu tweets trong khoảng thời gian hai tuần bằng cách sử dụng Twitter trực tuyến API này dẫn đến một corpus của 8,9 triệu tin nhắn ("tweet") đăng trên 2,6 triệu người sử dụng. Về 2,7 triệu của các tweets, hoặc 31%, đã trả lời cho một tweet đăng bởi người dùng khác, trong khi nửa triệu (6%) là retweets. Gần 2 triệu (22 %) của các tin nhắn có chứa một URL. "
  • Gremlin - một Turing-đầy đủ, đồ thị dựa trên ngôn ngữ lập trình - GitHub - Gremlin là một Turing-đầy đủ, đồ thị dựa trên ngôn ngữ lập trình phát triển trong Java 1.6 trở lên cho khóa / giá trị cặp đồ thị đa quan hệ được gọi là đồ thị bất động sản. Gremlin làm cho sử dụng rộng rãi của ngôn ngữ XPath 1.0 để hỗ trợ traversals đồ thị phức tạp. Ngôn ngữ này có ứng dụng trong các lĩnh vực đồ thị truy vấn, phân tích, và thao tác. Kết nối tồn tại cho các hệ thống quản lý dữ liệu sau đây:

    * TinkerGraph trong bộ nhớ đồ thị
    * Neo4j đồ thị cơ sở dữ liệu
    * Sesame 2.0 cửa hàng RDF phù hợp
    * Cơ sở dữ liệu tài liệu MongoDB

    Các tài liệu cho Gremlin có thể được tìm thấy tại địa điểm này. Cuối cùng, vui lòng truy cập TinkerPop cho các sản phẩm phần mềm khác.

  • Ngôn ngữ lập trình C: 4.10 - bởi Kernighan và Ritchie & Lovecraft - làm mất hiệu lực Rlyeh
    (Int mene [], int wgah, int nagl) {
    int Ia, fhtagn;
    if (wgah> = nagl) return;
    swap (mene, wgah, (wgah + nagl) / 2);
    fhtagn = wgah;
    for (Ia = wgah + 1; Ia <= nagl; Ia ++)
    if (mene [Ia] <mene [wgah])
    swap (mene, ++ fhtagn, Ia);
    swap (mene, wgah, fhtagn);
    Rlyeh (mene, wgah, fhtagn-1);
    Rlyeh (mene, fhtagn + 1, nagl);

    } // PH'NGLUI MGLW'NAFH Cthulhu!

  • Làm thế nào để chuyển đổi địa chỉ email vào tên, tuổi, dân tộc, khuynh hướng tình dục - Điều này là rất Meta - "Lưu danh sách email của bạn như là một tập tin CSV (chỉ cần dấu phẩy tách các địa chỉ email) Tải lên tập tin này vào tài khoản facebook của bạn nếu bạn muốn. thêm chúng như bạn bè. Thì đấy, facebook sẽ cung cấp cho bạn tất cả các hồ sơ của tất cả những người sử dụng (trong thử nghiệm của tôi, khoảng 80% danh sách email của tôi có cấu hình facebook). Bây giờ, nhấp chuột vào mỗi hồ sơ, và bởi vì các thiết lập mặc định facebook mới , mà làm cho tất cả các công bố thông tin, khoảng 95% các thông tin người sử dụng có sẵn để bạn có thể thu hoạch. "
  • Microsoft Security Development Lifecycle (SDL): Công cụ Repository - Một bộ sưu tập trước đây chỉ dành cho nội công cụ bảo mật từ Microsoft, bao gồm chống XSS, kiểm tra lông tơ, FxCop, mô hình hóa mối đe dọa, binscope, bây giờ đã có thể download miễn phí.
  • Analytics X Prize - Trang chủ - Dự báo tỷ lệ giết người ở Philadelphia - Giải Analytics X là một cuộc thi đang diễn ra để áp dụng phân tích, mô hình hóa, và thống kê để giải quyết các vấn đề xã hội có ảnh hưởng đến các thành phố của chúng tôi. Nó kết hợp các lĩnh vực thống kê, toán học và khoa học xã hội để hiểu được nguyên nhân gốc rễ của rối loạn chức năng trong các khu phố của chúng tôi. Hiểu được những mối quan hệ và phát hiện các biến cao nhất tương quan cho phép chúng tôi triển khai nguồn lực hạn chế của chúng tôi hiệu quả hơn và nhắm mục tiêu các biến sẽ có tác động tích cực lớn nhất về cải thiện.
  • PeteSearch: Làm thế nào để tìm kiếm thông tin người sử dụng từ một địa chỉ email - FindByEmail đang phát hành như là mã nguồn mở. Bạn vượt qua nó một địa chỉ email, và nó truy vấn 11 API công cộng khác nhau để khám phá các dịch vụ thông tin gì có trên người sử dụng với địa chỉ email.
  • Các biện pháp đo: Ngoài PageRank: Học tập với nội dung và Networks - Kết luận: học dựa trên các nội dung và dữ liệu mạng là tình trạng hiện nay của nghệ thuật Có một bài báo tuyệt vời và nói về cá nhân trong Google News rằng họ sử dụng nội dung cho mục đích này, và sau đó người dùng nhấp vào dòng để cung cấp cá nhân, tức là giới thiệu bài viết cụ thể trong từng cụm tại chỗ. Vấn đề là lọc nội dung là thường (như chúng tôi nói trong nghiên cứu) "cách khó khăn hơn." Giả sử bạn có một đồ thị xã hội, một loạt các văn bản, và bạn biết rằng một số người dùng trong đồ thị xã hội như một số tài liệu, và bạn muốn giới thiệu các tài liệu khác mà bạn nghĩ rằng họ sẽ thích. Sử dụng phương pháp tiếp cận dựa trên mạng, bạn có thể xem xét việc phân nhóm người dùng dựa trên đồng visitaion (họ đã cùng thích một số tài liệu). Điều này quy mô lớn, và nó internationalizes tuyệt vời. Nếu bạn bắt đầu giải nén các tính năng từ các tài liệu bản thân, sau đó những gì bạn xây dựng cho tiếng Anh có thể không làm việc tốt cho thị trường Trung Quốc. Ngoài ra, có rất nhiều dữ liệu trong văn bản hơn là trong đồ thị xã hội
  • python-docx mikemaccana tại master - GitHub - MIT cấp phép thư viện Python để đọc / ghi tập tin định dạng Microsoft Word docx. "Các mô-đun docx đọc và viết Microsoft Office Word 2007 tập tin docx. Đây được gọi là 'WordML', 'Office Open XML' và 'Open XML' bởi Microsoft. Họ có thể được mở trong Microsoft Office 2007, Microsoft Office 2008 Mac, OpenOffice.org 2.2, và Apple iWork 08. Các module được tạo ra khi tôi đang tìm kiếm một sự hỗ trợ Python cho các tập tin .doc MS Word, nhưng chỉ có thể tìm thấy hack khác nhau liên quan đến COM tự động hóa, kêu gọi net hoặc Java, hoặc tự động OpenOffice hoặc MS Office. "

Bookmarks for December 31st through January 16th

These are my links for December 31st through January 16th:

  • StarCraft AI Competition | Expressive Intelligence Studio – AI bot warfare competition using a hacked API to run StarCraft, will be held at AIIDE2010 in October 2010.
    The competition will use StarCraft Brood War 1.16.1. Bots for StarCraft can be developed using the Broodwar API, which provides hooks into StarCraft and enables the development of custom AI for StarCraft. A C++ interface enables developers to query the current state of the game and issue orders to units. An introduction to the Broodwar API is available here. Instructions for building a bot that communicates with a remote process are available here. There is also a Forum. We encourage submission of bots that make use of advanced AI techniques. Some ideas are:
    * Planning
    * Data Mining
    * Machine Learning
    * Case-Based Reasoning
  • Measuring Measures: Learning About Statistical Learning – A "quick start guide" for statistical and machine learning systems, good collection of references.
  • Berkowitz et al : The use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems (2006) – Berkowitz, Steven D., Woodward, Lloyd H., & Woodward, Caitlin. (2006). Use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems. Originally intended for publication in updating the 1988 volume, eds., Wellman and Berkowitz, Social Structures: A Network Approach (Cambridge University Press). Steve died in November, 2003. See Barry Wellman's “Steve Berkowitz: A Network Pioneer has passed away,” in Connections 25(2), 2003. It has not been possible to add the updating of references or of the quality of graphics that might have been possible if Berkowitz were alive. An early version of the article appeared in the Proceedings of the Session on Combating Terrorist Networks: Current Research in Social Network Analysis for the New War Fighting Environment. 8th International Command and Control Research and Technology Symposium. National Defense University, Washington, DC June 17-19, 2003
  • SSH Tunneling through web filters | s-anand.net – Step by step tutorial on using Putty and an EC2 instance to set up a private web proxy on demand.
  • PyDroid GUI automation toolkit – GitHub – What is Pydroid?

    Pydroid is a simple toolkit for automating and scripting repetitive tasks, especially those involving a GUI, with Python. It includes functions for controlling the mouse and keyboard, finding colors and bitmaps on-screen, as well as displaying cross-platform alerts.
    Why use Pydroid?

    * Testing a GUI application for bugs and edge cases
    o You might think your app is stable, but what happens if you press that button 5000 times?
    * Automating games
    o Writing a script to beat that crappy flash game can be so much more gratifying than spending hours playing it yourself.
    * Freaking out friends and family
    o Well maybe this isn't really a practical use, but…

  • Time Series Data Library – More data sets – "This is a collection of about 800 time series drawn from many different fields.Agriculture Chemistry Crime Demography Ecology Finance Health Hydrology Industry Labour Market Macro-Economics Meteorology Micro-Economics Miscellaneous Physics Production Sales Simulated series Sport Transport & Tourism Tree-rings Utilities"
  • How informative is Twitter? » SemanticHacker Blog – "We undertook a small study to characterize the different types of messages that can be found on Twitter. We downloaded a sample of tweets over a two-week period using the Twitter streaming API. This resulted in a corpus of 8.9 million messages (”tweets”) posted by 2.6 million unique users. About 2.7 million of these tweets, or 31%, were replies to a tweet posted by another user, while half a million (6%) were retweets. Almost 2 million (22%) of the messages contained a URL."
  • Gremlin – a Turing-complete, graph-based programming language – GitHub – Gremlin is a Turing-complete, graph-based programming language developed in Java 1.6+ for key/value-pair multi-relational graphs known as property graphs. Gremlin makes extensive use of the XPath 1.0 language to support complex graph traversals. This language has applications in the areas of graph query, analysis, and manipulation. Connectors exist for the following data management systems:

    * TinkerGraph in-memory graph
    * Neo4j graph database
    * Sesame 2.0 compliant RDF stores
    * MongoDB document database

    The documentation for Gremlin can be found at this location. Finally, please visit TinkerPop for other software products.

  • The C Programming Language: 4.10 – by Kernighan & Ritchie & Lovecraft – void Rlyeh
    (int mene[], int wgah, int nagl) {
    int Ia, fhtagn;
    if (wgah>=nagl) return;
    swap (mene,wgah,(wgah+nagl)/2);
    fhtagn = wgah;
    for (Ia=wgah+1; Ia<=nagl; Ia++)
    if (mene[Ia]<mene[wgah])
    swap (mene,++fhtagn,Ia);
    swap (mene,wgah,fhtagn);
    Rlyeh (mene,wgah,fhtagn-1);
    Rlyeh (mene,fhtagn+1,nagl);

    } // PH'NGLUI MGLW'NAFH CTHULHU!

  • How to convert email addresses into name, age, ethnicity, sexual orientation – This is so Meta – "Save your email list as a CSV file (just comma separate those email addresses). Upload this file to your facebook account as if you wanted to add them as friends. Voila, facebook will give you all the profiles of all those users (in my test, about 80% of my email lists have facebook profiles). Now, click through each profile, and because of the new default facebook settings, which makes all information public, about 95% of the user info is available for you to harvest."
  • Microsoft Security Development Lifecycle (SDL): Tools Repository – A collection of previously internal-only security tools from Microsoft, including anti-xss, fuzz test, fxcop, threat modeling, binscope, now available for free download.
  • Analytics X Prize – Home – Forecast the murder rate in Philadelphia – The Analytics X Prize is an ongoing contest to apply analytics, modeling, and statistics to solve the social problems that affect our cities. It combines the fields of statistics, mathematics, and social science to understand the root causes of dysfunction in our neighborhoods. Understanding these relationships and discovering the most highly correlated variables allows us to deploy our limited resources more effectively and target the variables that will have the greatest positive impact on improvement.
  • PeteSearch: How to find user information from an email address – FindByEmail code released as open-source. You pass it an email address, and it queries 11 different public APIs to discover what information those services have on the user with that email address.
  • Measuring Measures: Beyond PageRank: Learning with Content and Networks – Conclusion: learning based on content and network data is the current state of the art There is a great paper and talk about personalization in Google News they use content for this purpose, and then user click streams to provide personalization, ie recommend specific articles within each topical cluster. The issue is content filtering is typically (as we say in research) "way harder." Suppose you have a social graph, a bunch of documents, and you know that some users in the social graph like some documents, and you want to recommend other documents that you think they will like. Using approaches based on Networks, you might consider clustering users based on co-visitaion (they have co-liked some of the documents). This scales great, and it internationalizes great. If you start extracting features from the documents themselves, then what you build for English may not work as well for the Chinese market. In addition, there is far more data in the text than there is in the social graph
  • mikemaccana's python-docx at master – GitHub – MIT-licensed Python library to read/write Microsoft Word docx format files. "The docx module reads and writes Microsoft Office Word 2007 docx files. These are referred to as 'WordML', 'Office Open XML' and 'Open XML' by Microsoft. They can be opened in Microsoft Office 2007, Microsoft Mac Office 2008, OpenOffice.org 2.2, and Apple iWork 08. The module was created when I was looking for a Python support for MS Word .doc files, but could only find various hacks involving COM automation, calling .net or Java, or automating OpenOffice or MS Office."

Bookmarks cho 31 tháng 12 thông qua ngày 17 tháng một

These are my links for December 31st through January 17th:

  • Khan Academy – The Khan Academy is a not-for-profit organization with the mission of providing a high quality education to anyone, anywhere.

    We have 1000+ videos on YouTube covering everything from basic arithmetic and algebra to differential equations, physics, chemistry, biology and finance which have been recorded by Salman Khan.

  • StarCraft AI Competition | Expressive Intelligence Studio – AI bot warfare competition using a hacked API to run StarCraft, will be held at AIIDE2010 in October 2010.
    The competition will use StarCraft Brood War 1.16.1. Bots for StarCraft can be developed using the Broodwar API, which provides hooks into StarCraft and enables the development of custom AI for StarCraft. A C++ interface enables developers to query the current state of the game and issue orders to units. An introduction to the Broodwar API is available here. Instructions for building a bot that communicates with a remote process are available here. There is also a Forum. We encourage submission of bots that make use of advanced AI techniques. Some ideas are:
    * Planning
    * Data Mining
    * Machine Learning
    * Case-Based Reasoning
  • Measuring Measures: Learning About Statistical Learning – A "quick start guide" for statistical and machine learning systems, good collection of references.
  • Berkowitz et al : The use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems (2006) – Berkowitz, Steven D., Woodward, Lloyd H., & Woodward, Caitlin. (2006). Use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems. Originally intended for publication in updating the 1988 volume, eds., Wellman and Berkowitz, Social Structures: A Network Approach (Cambridge University Press). Steve died in November, 2003. See Barry Wellman's “Steve Berkowitz: A Network Pioneer has passed away,” in Connections 25(2), 2003. It has not been possible to add the updating of references or of the quality of graphics that might have been possible if Berkowitz were alive. An early version of the article appeared in the Proceedings of the Session on Combating Terrorist Networks: Current Research in Social Network Analysis for the New War Fighting Environment. 8th International Command and Control Research and Technology Symposium. National Defense University, Washington, DC June 17-19, 2003
  • SSH Tunneling through web filters | s-anand.net – Step by step tutorial on using Putty and an EC2 instance to set up a private web proxy on demand.
  • PyDroid GUI automation toolkit – GitHub – What is Pydroid?

    Pydroid is a simple toolkit for automating and scripting repetitive tasks, especially those involving a GUI, with Python. It includes functions for controlling the mouse and keyboard, finding colors and bitmaps on-screen, as well as displaying cross-platform alerts.
    Why use Pydroid?

    * Testing a GUI application for bugs and edge cases
    o You might think your app is stable, but what happens if you press that button 5000 times?
    * Automating games
    o Writing a script to beat that crappy flash game can be so much more gratifying than spending hours playing it yourself.
    * Freaking out friends and family
    o Well maybe this isn't really a practical use, but…

  • Time Series Data Library – More data sets – "This is a collection of about 800 time series drawn from many different fields.Agriculture Chemistry Crime Demography Ecology Finance Health Hydrology Industry Labour Market Macro-Economics Meteorology Micro-Economics Miscellaneous Physics Production Sales Simulated series Sport Transport & Tourism Tree-rings Utilities"
  • How informative is Twitter? » SemanticHacker Blog – "We undertook a small study to characterize the different types of messages that can be found on Twitter. We downloaded a sample of tweets over a two-week period using the Twitter streaming API. This resulted in a corpus of 8.9 million messages (”tweets”) posted by 2.6 million unique users. About 2.7 million of these tweets, or 31%, were replies to a tweet posted by another user, while half a million (6%) were retweets. Almost 2 million (22%) of the messages contained a URL."
  • Gremlin – a Turing-complete, graph-based programming language – GitHub – Gremlin is a Turing-complete, graph-based programming language developed in Java 1.6+ for key/value-pair multi-relational graphs known as property graphs. Gremlin makes extensive use of the XPath 1.0 language to support complex graph traversals. This language has applications in the areas of graph query, analysis, and manipulation. Connectors exist for the following data management systems:

    * TinkerGraph in-memory graph
    * Neo4j graph database
    * Sesame 2.0 compliant RDF stores
    * MongoDB document database

    The documentation for Gremlin can be found at this location. Finally, please visit TinkerPop for other software products.

  • The C Programming Language: 4.10 – by Kernighan & Ritchie & Lovecraft – void Rlyeh
    (int mene[], int wgah, int nagl) {
    int Ia, fhtagn;
    if (wgah>=nagl) return;
    swap (mene,wgah,(wgah+nagl)/2);
    fhtagn = wgah;
    for (Ia=wgah+1; Ia<=nagl; Ia++)
    if (mene[Ia]<mene[wgah])
    swap (mene,++fhtagn,Ia);
    swap (mene,wgah,fhtagn);
    Rlyeh (mene,wgah,fhtagn-1);
    Rlyeh (mene,fhtagn+1,nagl);

    } // PH'NGLUI MGLW'NAFH CTHULHU!

  • How to convert email addresses into name, age, ethnicity, sexual orientation – This is so Meta – "Save your email list as a CSV file (just comma separate those email addresses). Upload this file to your facebook account as if you wanted to add them as friends. Voila, facebook will give you all the profiles of all those users (in my test, about 80% of my email lists have facebook profiles). Now, click through each profile, and because of the new default facebook settings, which makes all information public, about 95% of the user info is available for you to harvest."
  • Microsoft Security Development Lifecycle (SDL): Tools Repository – A collection of previously internal-only security tools from Microsoft, including anti-xss, fuzz test, fxcop, threat modeling, binscope, now available for free download.
  • Analytics X Prize – Home – Forecast the murder rate in Philadelphia – The Analytics X Prize is an ongoing contest to apply analytics, modeling, and statistics to solve the social problems that affect our cities. It combines the fields of statistics, mathematics, and social science to understand the root causes of dysfunction in our neighborhoods. Understanding these relationships and discovering the most highly correlated variables allows us to deploy our limited resources more effectively and target the variables that will have the greatest positive impact on improvement.
  • PeteSearch: How to find user information from an email address – FindByEmail code released as open-source. You pass it an email address, and it queries 11 different public APIs to discover what information those services have on the user with that email address.
  • Measuring Measures: Beyond PageRank: Learning with Content and Networks – Conclusion: learning based on content and network data is the current state of the art There is a great paper and talk about personalization in Google News they use content for this purpose, and then user click streams to provide personalization, ie recommend specific articles within each topical cluster. The issue is content filtering is typically (as we say in research) "way harder." Suppose you have a social graph, a bunch of documents, and you know that some users in the social graph like some documents, and you want to recommend other documents that you think they will like. Using approaches based on Networks, you might consider clustering users based on co-visitaion (they have co-liked some of the documents). This scales great, and it internationalizes great. If you start extracting features from the documents themselves, then what you build for English may not work as well for the Chinese market. In addition, there is far more data in the text than there is in the social graph
  • mikemaccana's python-docx at master – GitHub – MIT-licensed Python library to read/write Microsoft Word docx format files. "The docx module reads and writes Microsoft Office Word 2007 docx files. These are referred to as 'WordML', 'Office Open XML' and 'Open XML' by Microsoft. They can be opened in Microsoft Office 2007, Microsoft Mac Office 2008, OpenOffice.org 2.2, and Apple iWork 08. The module was created when I was looking for a Python support for MS Word .doc files, but could only find various hacks involving COM automation, calling .net or Java, or automating OpenOffice or MS Office."

Bookmarks cho 31 tháng 12 thông qua ngày 17 tháng một

These are my links for December 31st through January 17th:

  • Khan Academy – The Khan Academy is a not-for-profit organization with the mission of providing a high quality education to anyone, anywhere.

    We have 1000+ videos on YouTube covering everything from basic arithmetic and algebra to differential equations, physics, chemistry, biology and finance which have been recorded by Salman Khan.

  • StarCraft AI Competition | Expressive Intelligence Studio – AI bot warfare competition using a hacked API to run StarCraft, will be held at AIIDE2010 in October 2010.
    The competition will use StarCraft Brood War 1.16.1. Bots for StarCraft can be developed using the Broodwar API, which provides hooks into StarCraft and enables the development of custom AI for StarCraft. A C++ interface enables developers to query the current state of the game and issue orders to units. An introduction to the Broodwar API is available here. Instructions for building a bot that communicates with a remote process are available here. There is also a Forum. We encourage submission of bots that make use of advanced AI techniques. Some ideas are:
    * Planning
    * Data Mining
    * Machine Learning
    * Case-Based Reasoning
  • Measuring Measures: Learning About Statistical Learning – A "quick start guide" for statistical and machine learning systems, good collection of references.
  • Berkowitz et al : The use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems (2006) – Berkowitz, Steven D., Woodward, Lloyd H., & Woodward, Caitlin. (2006). Use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems. Originally intended for publication in updating the 1988 volume, eds., Wellman and Berkowitz, Social Structures: A Network Approach (Cambridge University Press). Steve died in November, 2003. See Barry Wellman's “Steve Berkowitz: A Network Pioneer has passed away,” in Connections 25(2), 2003. It has not been possible to add the updating of references or of the quality of graphics that might have been possible if Berkowitz were alive. An early version of the article appeared in the Proceedings of the Session on Combating Terrorist Networks: Current Research in Social Network Analysis for the New War Fighting Environment. 8th International Command and Control Research and Technology Symposium. National Defense University, Washington, DC June 17-19, 2003
  • SSH Tunneling through web filters | s-anand.net – Step by step tutorial on using Putty and an EC2 instance to set up a private web proxy on demand.
  • PyDroid GUI automation toolkit – GitHub – What is Pydroid?

    Pydroid is a simple toolkit for automating and scripting repetitive tasks, especially those involving a GUI, with Python. It includes functions for controlling the mouse and keyboard, finding colors and bitmaps on-screen, as well as displaying cross-platform alerts.
    Why use Pydroid?

    * Testing a GUI application for bugs and edge cases
    o You might think your app is stable, but what happens if you press that button 5000 times?
    * Automating games
    o Writing a script to beat that crappy flash game can be so much more gratifying than spending hours playing it yourself.
    * Freaking out friends and family
    o Well maybe this isn't really a practical use, but…

  • Time Series Data Library – More data sets – "This is a collection of about 800 time series drawn from many different fields.Agriculture Chemistry Crime Demography Ecology Finance Health Hydrology Industry Labour Market Macro-Economics Meteorology Micro-Economics Miscellaneous Physics Production Sales Simulated series Sport Transport & Tourism Tree-rings Utilities"
  • How informative is Twitter? » SemanticHacker Blog – "We undertook a small study to characterize the different types of messages that can be found on Twitter. We downloaded a sample of tweets over a two-week period using the Twitter streaming API. This resulted in a corpus of 8.9 million messages (”tweets”) posted by 2.6 million unique users. About 2.7 million of these tweets, or 31%, were replies to a tweet posted by another user, while half a million (6%) were retweets. Almost 2 million (22%) of the messages contained a URL."
  • Gremlin – a Turing-complete, graph-based programming language – GitHub – Gremlin is a Turing-complete, graph-based programming language developed in Java 1.6+ for key/value-pair multi-relational graphs known as property graphs. Gremlin makes extensive use of the XPath 1.0 language to support complex graph traversals. This language has applications in the areas of graph query, analysis, and manipulation. Connectors exist for the following data management systems:

    * TinkerGraph in-memory graph
    * Neo4j graph database
    * Sesame 2.0 compliant RDF stores
    * MongoDB document database

    The documentation for Gremlin can be found at this location. Finally, please visit TinkerPop for other software products.

  • The C Programming Language: 4.10 – by Kernighan & Ritchie & Lovecraft – void Rlyeh
    (int mene[], int wgah, int nagl) {
    int Ia, fhtagn;
    if (wgah>=nagl) return;
    swap (mene,wgah,(wgah+nagl)/2);
    fhtagn = wgah;
    for (Ia=wgah+1; Ia<=nagl; Ia++)
    if (mene[Ia]<mene[wgah])
    swap (mene,++fhtagn,Ia);
    swap (mene,wgah,fhtagn);
    Rlyeh (mene,wgah,fhtagn-1);
    Rlyeh (mene,fhtagn+1,nagl);

    } // PH'NGLUI MGLW'NAFH CTHULHU!

  • How to convert email addresses into name, age, ethnicity, sexual orientation – This is so Meta – "Save your email list as a CSV file (just comma separate those email addresses). Upload this file to your facebook account as if you wanted to add them as friends. Voila, facebook will give you all the profiles of all those users (in my test, about 80% of my email lists have facebook profiles). Now, click through each profile, and because of the new default facebook settings, which makes all information public, about 95% of the user info is available for you to harvest."
  • Microsoft Security Development Lifecycle (SDL): Tools Repository – A collection of previously internal-only security tools from Microsoft, including anti-xss, fuzz test, fxcop, threat modeling, binscope, now available for free download.
  • Analytics X Prize – Home – Forecast the murder rate in Philadelphia – The Analytics X Prize is an ongoing contest to apply analytics, modeling, and statistics to solve the social problems that affect our cities. It combines the fields of statistics, mathematics, and social science to understand the root causes of dysfunction in our neighborhoods. Understanding these relationships and discovering the most highly correlated variables allows us to deploy our limited resources more effectively and target the variables that will have the greatest positive impact on improvement.
  • PeteSearch: How to find user information from an email address – FindByEmail code released as open-source. You pass it an email address, and it queries 11 different public APIs to discover what information those services have on the user with that email address.
  • Measuring Measures: Beyond PageRank: Learning with Content and Networks – Conclusion: learning based on content and network data is the current state of the art There is a great paper and talk about personalization in Google News they use content for this purpose, and then user click streams to provide personalization, ie recommend specific articles within each topical cluster. The issue is content filtering is typically (as we say in research) "way harder." Suppose you have a social graph, a bunch of documents, and you know that some users in the social graph like some documents, and you want to recommend other documents that you think they will like. Using approaches based on Networks, you might consider clustering users based on co-visitaion (they have co-liked some of the documents). This scales great, and it internationalizes great. If you start extracting features from the documents themselves, then what you build for English may not work as well for the Chinese market. In addition, there is far more data in the text than there is in the social graph
  • mikemaccana's python-docx at master – GitHub – MIT-licensed Python library to read/write Microsoft Word docx format files. "The docx module reads and writes Microsoft Office Word 2007 docx files. These are referred to as 'WordML', 'Office Open XML' and 'Open XML' by Microsoft. They can be opened in Microsoft Office 2007, Microsoft Mac Office 2008, OpenOffice.org 2.2, and Apple iWork 08. The module was created when I was looking for a Python support for MS Word .doc files, but could only find various hacks involving COM automation, calling .net or Java, or automating OpenOffice or MS Office."

Bookmarks for June 13th through January 16th

These are my links for June 13th through January 16th:

  • StarCraft AI Competition | Expressive Intelligence Studio – AI bot warfare competition using a hacked API to run StarCraft, will be held at AIIDE2010 in October 2010.
    The competition will use StarCraft Brood War 1.16.1. Bots for StarCraft can be developed using the Broodwar API, which provides hooks into StarCraft and enables the development of custom AI for StarCraft. A C++ interface enables developers to query the current state of the game and issue orders to units. An introduction to the Broodwar API is available here. Instructions for building a bot that communicates with a remote process are available here. There is also a Forum. We encourage submission of bots that make use of advanced AI techniques. Some ideas are:
    * Planning
    * Data Mining
    * Machine Learning
    * Case-Based Reasoning
  • Measuring Measures: Learning About Statistical Learning – A "quick start guide" for statistical and machine learning systems, good collection of references.
  • Berkowitz et al : The use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems (2006) – Berkowitz, Steven D., Woodward, Lloyd H., & Woodward, Caitlin. (2006). Use of formal methods to map, analyze and interpret hawala and terrorist-related alternative remittance systems. Originally intended for publication in updating the 1988 volume, eds., Wellman and Berkowitz, Social Structures: A Network Approach (Cambridge University Press). Steve died in November, 2003. See Barry Wellman's “Steve Berkowitz: A Network Pioneer has passed away,” in Connections 25(2), 2003. It has not been possible to add the updating of references or of the quality of graphics that might have been possible if Berkowitz were alive. An early version of the article appeared in the Proceedings of the Session on Combating Terrorist Networks: Current Research in Social Network Analysis for the New War Fighting Environment. 8th International Command and Control Research and Technology Symposium. National Defense University, Washington, DC June 17-19, 2003
  • SSH Tunneling through web filters | s-anand.net – Step by step tutorial on using Putty and an EC2 instance to set up a private web proxy on demand.
  • PyDroid GUI automation toolkit – GitHub – What is Pydroid?

    Pydroid is a simple toolkit for automating and scripting repetitive tasks, especially those involving a GUI, with Python. It includes functions for controlling the mouse and keyboard, finding colors and bitmaps on-screen, as well as displaying cross-platform alerts.
    Why use Pydroid?

    * Testing a GUI application for bugs and edge cases
    o You might think your app is stable, but what happens if you press that button 5000 times?
    * Automating games
    o Writing a script to beat that crappy flash game can be so much more gratifying than spending hours playing it yourself.
    * Freaking out friends and family
    o Well maybe this isn't really a practical use, but…

  • Time Series Data Library – More data sets – "This is a collection of about 800 time series drawn from many different fields.Agriculture Chemistry Crime Demography Ecology Finance Health Hydrology Industry Labour Market Macro-Economics Meteorology Micro-Economics Miscellaneous Physics Production Sales Simulated series Sport Transport & Tourism Tree-rings Utilities"
  • How informative is Twitter? » SemanticHacker Blog – "We undertook a small study to characterize the different types of messages that can be found on Twitter. We downloaded a sample of tweets over a two-week period using the Twitter streaming API. This resulted in a corpus of 8.9 million messages (”tweets”) posted by 2.6 million unique users. About 2.7 million of these tweets, or 31%, were replies to a tweet posted by another user, while half a million (6%) were retweets. Almost 2 million (22%) of the messages contained a URL."
  • Gremlin – a Turing-complete, graph-based programming language – GitHub – Gremlin is a Turing-complete, graph-based programming language developed in Java 1.6+ for key/value-pair multi-relational graphs known as property graphs. Gremlin makes extensive use of the XPath 1.0 language to support complex graph traversals. This language has applications in the areas of graph query, analysis, and manipulation. Connectors exist for the following data management systems:

    * TinkerGraph in-memory graph
    * Neo4j graph database
    * Sesame 2.0 compliant RDF stores
    * MongoDB document database

    The documentation for Gremlin can be found at this location. Finally, please visit TinkerPop for other software products.

  • The C Programming Language: 4.10 – by Kernighan & Ritchie & Lovecraft – void Rlyeh
    (int mene[], int wgah, int nagl) {
    int Ia, fhtagn;
    if (wgah>=nagl) return;
    swap (mene,wgah,(wgah+nagl)/2);
    fhtagn = wgah;
    for (Ia=wgah+1; Ia<=nagl; Ia++)
    if (mene[Ia]<mene[wgah])
    swap (mene,++fhtagn,Ia);
    swap (mene,wgah,fhtagn);
    Rlyeh (mene,wgah,fhtagn-1);
    Rlyeh (mene,fhtagn+1,nagl);

    } // PH'NGLUI MGLW'NAFH CTHULHU!

  • How to convert email addresses into name, age, ethnicity, sexual orientation – This is so Meta – "Save your email list as a CSV file (just comma separate those email addresses). Upload this file to your facebook account as if you wanted to add them as friends. Voila, facebook will give you all the profiles of all those users (in my test, about 80% of my email lists have facebook profiles). Now, click through each profile, and because of the new default facebook settings, which makes all information public, about 95% of the user info is available for you to harvest."
  • Microsoft Security Development Lifecycle (SDL): Tools Repository – A collection of previously internal-only security tools from Microsoft, including anti-xss, fuzz test, fxcop, threat modeling, binscope, now available for free download.
  • Analytics X Prize – Home – Forecast the murder rate in Philadelphia – The Analytics X Prize is an ongoing contest to apply analytics, modeling, and statistics to solve the social problems that affect our cities. It combines the fields of statistics, mathematics, and social science to understand the root causes of dysfunction in our neighborhoods. Understanding these relationships and discovering the most highly correlated variables allows us to deploy our limited resources more effectively and target the variables that will have the greatest positive impact on improvement.
  • PeteSearch: How to find user information from an email address – FindByEmail code released as open-source. You pass it an email address, and it queries 11 different public APIs to discover what information those services have on the user with that email address.
  • Measuring Measures: Beyond PageRank: Learning with Content and Networks – Conclusion: learning based on content and network data is the current state of the art There is a great paper and talk about personalization in Google News they use content for this purpose, and then user click streams to provide personalization, ie recommend specific articles within each topical cluster. The issue is content filtering is typically (as we say in research) "way harder." Suppose you have a social graph, a bunch of documents, and you know that some users in the social graph like some documents, and you want to recommend other documents that you think they will like. Using approaches based on Networks, you might consider clustering users based on co-visitaion (they have co-liked some of the documents). This scales great, and it internationalizes great. If you start extracting features from the documents themselves, then what you build for English may not work as well for the Chinese market. In addition, there is far more data in the text than there is in the social graph
  • mikemaccana's python-docx at master – GitHub – MIT-licensed Python library to read/write Microsoft Word docx format files. "The docx module reads and writes Microsoft Office Word 2007 docx files. These are referred to as 'WordML', 'Office Open XML' and 'Open XML' by Microsoft. They can be opened in Microsoft Office 2007, Microsoft Mac Office 2008, OpenOffice.org 2.2, and Apple iWork 08. The module was created when I was looking for a Python support for MS Word .doc files, but could only find various hacks involving COM automation, calling .net or Java, or automating OpenOffice or MS Office."
  • Handy one-liners for SED – Sed expressions are powerful, but somewhat obscure and easy to screw up. A handy cheat sheet for common tasks.

Slide của tôi từ Tìm kiếm Bảng điều chỉnh thời gian thực tại SES Chicago tuần trước

Mặc dù tìm kiếm thời gian thực là khá mới, như chúng ta kết thúc năm 2009, khả năng chỉ số và kết quả tìm kiếm mới đang nhanh chóng trở thành một loại hàng hóa, với Bing, khởi động khác nhau, và bây giờ tất cả các trạng thái tích hợp Google nguồn cấp dữ liệu từ các dịch vụ mạng xã hội. Các tập tiếp theo của những thách thức trong năm 2010 sẽ vào khoảng cung cấp phù hợp tốt hơn, khám phá thông tin, thăm dò và tìm kiếm chủ đề cho xã hội, sử dụng tín hiệu từ hành vi động của người sử dụng và tương tác với các đồ thị xã hội và chủ đề.

Tôi đã đưa ra một cuộc trò chuyện ngắn về thời gian thực và tìm kiếm xã hội cho một bảng điều khiển ở SES Chicago tuần trước. Tôi đã bước xuống trong vài tháng qua làm việc trên Bing Twitter Search, vậy bây giờ mà khởi động đầu tiên là ra cửa đó là một cơ hội tốt đẹp để nói chuyện với mọi người về một số công việc chúng tôi đang làm. Có rất nhiều quan tâm trong tình cảm, xu hướng, xã hội và đồ thị phân tích slide (9 và 10). Tôi sẽ viết về những người trong một bài riêng biệt, nhưng muốn có được trình bày cho những người đã được hỏi về nó.

Có gì khác nhau về thời gian thực và xã hội tìm kiếm - Hyun Joong Slides Đối với SES Chicago 09 Tháng 12

Có gì khác nhau về thời gian thực và xã hội tìm kiếm - Hyun Joong Slides Đối với SES Chicago 09 Tháng 12 - Presentation Transcript

  1. Có gì khác nhau về thời gian thực và tìm kiếm xã hội?
    Hồ John Lee
    Hiệu trưởng Giám đốc chương trình
    Bing Search Xã hội
    Chiến lược Công cụ tìm kiếm
    Chicago - 07 Tháng 12 2009
  2. Real Time Search tốt cho những gì, Dù sao?
  3. Twitter là Great cho Xem Các tu hoảng loạn Unfold Sống
    ... Hoặc tìm kiếm bóng bay
    http://xkcd.com/574/
  4. Một số đặc điểm của Twitter / phương tiện truyền thông xã hội
    Tức thì, tình cảm, Ngắn gọn
    Không phải luôn luôn chính xác
    Cảm xúc, phản ứng, ấn tượng
    Bối cảnh thường xuyên là điều cần thiết để xác định ý nghĩa
    Cử chỉ -user, #hashtag, RT, yêu thích, sau
    Cộng đồng tự tổ chức của sự chú ý và thẩm quyền
    Nội dung sau sự chú ý
    Người ta nói về những gì người khác đang nói về
    Quan sát và bình luận từ khắp mọi nơi
    Nếu không có nội dung, bạn có thể yêu cầu một số
    Đầu cực đoan và bảo hiểm đuôi
    Thấp phù hợp "tiếng ồn" có thể trở thành "tín hiệu" trong tổng hợp
  5. Sản phẩm hoặc thương hiệu của bạn đột nhiên có thể là ở trung tâm của một cuộc trò chuyện rất lớn
    Tiger Woods
    Balloon Boy
    Breaking Câu chuyện
    Câu chuyện dai dẳng
    Câu chuyện lớn
    Câu chuyện lớn hơn
  6. Một số đặc điểm của thời gian thực / Social Search
    • Thời gian thực và tìm kiếm xã hội là chất lượng khác nhau từ tìm kiếm web truyền thống
    • Sự khác biệt trong bảng xếp hạng, phù hợp, sử dụng mô hình
    • Đồ thị xã hội, hành vi người dùng, vị trí, sự kiện tương quan và tín hiệu đầu vào khác
    • Tìm kiếm thời gian thực thường về phát hiện, không phải tìm kiếm cho mỗi gia nhập
    • "Là những gì mọi người nói về", tiếp theo là "mọi người đang nói gì về"
    • Lên trên thời gian thực và kết quả tìm kiếm xã hội thường sẽ khác với kết quả tìm kiếm web hàng đầu
  7. Bing Twitter Tìm kiếm trong nháy mắt
    Lên trên Tweets
    Liên kết Top chung
    Tweets / Niềm tin cho mỗi liên kết
    Người lớn bộ lọc / Spam; Tweets / Liên kết xếp hạng và liên quan
  8. Bing mùa thu năm 2009: Twitter dọc, Tin tức, MSN, Maps
    MSN địa phương bản
    Trang 2: Tweets hay Liên kết
    Trang 1: Tweets & Liên kết
    Twitter trả lời về Tin tức SERP
    MSN nóng chủ đề
  9. Chủ đề phạm vi / tâm lý, khối lượng, phân tích xu hướng
    Là những gì các tỷ lệ cơ bản của đề cập đến / tình cảm mỗi đơn vị thời gian?
    Những thay đổi trong dòng chảy sự chú ý xung quanh một chủ đề, vị trí, chủ đề
    Bạn cho tín hiệu tương quan từ nhiều nguồn
    Xem xét tính phù hợp nguồn và quyền lực cũng
  10. Phân tích đồ thị cho phù hợp và xếp hạng
    Chiến dịch tiếp thị Spam
    Cộng đồng tự nhiên kết nối
    Cộng đồng spam được đánh giá cao có thể nhìn thấy - không là một phần của một!
  11. Bing Maps Twitter Demo
  12. Để vượt lên trên tiếng ồn, có nhiều hơn để làm như tìm kiếm được xã hội hơn
    Plus ...
  13. Cảm ơn Bạn
    Hồ John Lee
    hojohn. lee @ microsoft.com
    twitter.com/hjl
Phiên họp đã được kiểm duyệt bởi Barbara Coll , Giám đốc điều hành, WebMama.com Inc., với tham luận viên Bill Fischer , đồng sáng lập và Giám đốc, Workdigital, Ltd., Rob Walk , Giám đốc, NovaRising, Nathan Stoll , đồng sáng lập, Aardvark, và Hồ John Lee , Hiệu trưởng Giám đốc chương trình, xã hội và Real Time Search, Microsoft Bing.

Slide của tôi từ Tìm kiếm Bảng điều chỉnh thời gian thực tại SES Chicago tuần trước

Mặc dù tìm kiếm thời gian thực là khá mới, như chúng ta kết thúc năm 2009, khả năng chỉ số và kết quả tìm kiếm mới đang nhanh chóng trở thành một loại hàng hóa, với Bing, khởi động khác nhau, và bây giờ tất cả các trạng thái tích hợp Google nguồn cấp dữ liệu từ các dịch vụ mạng xã hội. Các tập tiếp theo của những thách thức trong năm 2010 sẽ vào khoảng cung cấp phù hợp tốt hơn, khám phá thông tin, thăm dò và tìm kiếm chủ đề cho xã hội, sử dụng tín hiệu từ hành vi động của người sử dụng và tương tác với các đồ thị xã hội và chủ đề.

Tôi đã đưa ra một cuộc trò chuyện ngắn về thời gian thực và tìm kiếm xã hội cho một bảng điều khiển ở SES Chicago tuần trước. Tôi đã bước xuống trong vài tháng qua làm việc trên Bing Twitter Search, vậy bây giờ mà khởi động đầu tiên là ra cửa đó là một cơ hội tốt đẹp để nói chuyện với mọi người về một số công việc chúng tôi đang làm. Có rất nhiều quan tâm trong tình cảm, xu hướng, xã hội và đồ thị phân tích slide (9 và 10). Tôi sẽ viết về những người trong một bài riêng biệt, nhưng muốn có được trình bày cho những người đã được hỏi về nó.

Có gì khác nhau về thời gian thực và xã hội tìm kiếm - Hyun Joong Slides Đối với SES Chicago 09 Tháng 12

Có gì khác nhau về thời gian thực và xã hội tìm kiếm - Hyun Joong Slides Đối với SES Chicago 09 Tháng 12 - Presentation Transcript

  1. Có gì khác nhau về thời gian thực và tìm kiếm xã hội?
    Hồ John Lee
    Hiệu trưởng Giám đốc chương trình
    Bing Search Xã hội
    Chiến lược Công cụ tìm kiếm
    Chicago - 07 Tháng 12 2009
  2. Real Time Search tốt cho những gì, Dù sao?
  3. Twitter là Great cho Xem Các tu hoảng loạn Unfold Sống
    ... Hoặc tìm kiếm bóng bay
    http://xkcd.com/574/
  4. Một số đặc điểm của Twitter / phương tiện truyền thông xã hội
    Tức thì, tình cảm, Ngắn gọn
    Không phải luôn luôn chính xác
    Cảm xúc, phản ứng, ấn tượng
    Bối cảnh thường xuyên là điều cần thiết để xác định ý nghĩa
    Cử chỉ -user, #hashtag, RT, yêu thích, sau
    Cộng đồng tự tổ chức của sự chú ý và thẩm quyền
    Nội dung sau sự chú ý
    Người ta nói về những gì người khác đang nói về
    Quan sát và bình luận từ khắp mọi nơi
    Nếu không có nội dung, bạn có thể yêu cầu một số
    Đầu cực đoan và bảo hiểm đuôi
    Thấp phù hợp "tiếng ồn" có thể trở thành "tín hiệu" trong tổng hợp
  5. Sản phẩm hoặc thương hiệu của bạn đột nhiên có thể là ở trung tâm của một cuộc trò chuyện rất lớn
    Tiger Woods
    Balloon Boy
    Breaking Câu chuyện
    Câu chuyện dai dẳng
    Câu chuyện lớn
    Câu chuyện lớn hơn
  6. Một số đặc điểm của thời gian thực / Social Search
    • Thời gian thực và tìm kiếm xã hội là chất lượng khác nhau từ tìm kiếm web truyền thống
    • Sự khác biệt trong bảng xếp hạng, phù hợp, sử dụng mô hình
    • Đồ thị xã hội, hành vi người dùng, vị trí, sự kiện tương quan và tín hiệu đầu vào khác
    • Tìm kiếm thời gian thực thường về phát hiện, không phải tìm kiếm cho mỗi gia nhập
    • "Là những gì mọi người nói về", tiếp theo là "mọi người đang nói gì về"
    • Lên trên thời gian thực và kết quả tìm kiếm xã hội thường sẽ khác với kết quả tìm kiếm web hàng đầu
  7. Bing Twitter Tìm kiếm trong nháy mắt
    Lên trên Tweets
    Liên kết Top chung
    Tweets / Niềm tin cho mỗi liên kết
    Người lớn bộ lọc / Spam; Tweets / Liên kết xếp hạng và liên quan
  8. Bing mùa thu năm 2009: Twitter dọc, Tin tức, MSN, Maps
    MSN địa phương bản
    Trang 2: Tweets hay Liên kết
    Trang 1: Tweets & Liên kết
    Twitter trả lời về Tin tức SERP
    MSN nóng chủ đề
  9. Chủ đề phạm vi / tâm lý, khối lượng, phân tích xu hướng
    Là những gì các tỷ lệ cơ bản của đề cập đến / tình cảm mỗi đơn vị thời gian?
    Những thay đổi trong dòng chảy sự chú ý xung quanh một chủ đề, vị trí, chủ đề
    Bạn cho tín hiệu tương quan từ nhiều nguồn
    Xem xét tính phù hợp nguồn và quyền lực cũng
  10. Phân tích đồ thị cho phù hợp và xếp hạng
    Chiến dịch tiếp thị Spam
    Cộng đồng tự nhiên kết nối
    Cộng đồng spam được đánh giá cao có thể nhìn thấy - không là một phần của một!
  11. Bing Maps Twitter Demo
  12. Để vượt lên trên tiếng ồn, có nhiều hơn để làm như tìm kiếm được xã hội hơn
    Plus ...
  13. Cảm ơn Bạn
    Hồ John Lee
    hojohn. lee @ microsoft.com
    twitter.com/hjl
Phiên họp đã được kiểm duyệt bởi Barbara Coll , Giám đốc điều hành, WebMama.com Inc., với tham luận viên Bill Fischer , đồng sáng lập và Giám đốc, Workdigital, Ltd., Rob Walk , Giám đốc, NovaRising, Nathan Stoll , đồng sáng lập, Aardvark, và Hồ John Lee , Hiệu trưởng Giám đốc chương trình, xã hội và Real Time Search, Microsoft Bing.

Slide của tôi từ Tìm kiếm Bảng điều chỉnh thời gian thực tại SES Chicago tuần trước

Mặc dù tìm kiếm thời gian thực là khá mới, như chúng ta kết thúc năm 2009, khả năng chỉ số và kết quả tìm kiếm mới đang nhanh chóng trở thành một loại hàng hóa, với Bing, khởi động khác nhau, và bây giờ tất cả các trạng thái tích hợp Google nguồn cấp dữ liệu từ các dịch vụ mạng xã hội. Các tập tiếp theo của những thách thức trong năm 2010 sẽ vào khoảng cung cấp phù hợp tốt hơn, khám phá thông tin, thăm dò và tìm kiếm chủ đề cho xã hội, sử dụng tín hiệu từ hành vi động của người sử dụng và tương tác với các đồ thị xã hội và chủ đề.

Tôi đã đưa ra một cuộc trò chuyện ngắn về thời gian thực và tìm kiếm xã hội cho một bảng điều khiển ở SES Chicago tuần trước. Tôi đã bước xuống trong vài tháng qua làm việc trên Bing Twitter Search, vậy bây giờ mà khởi động đầu tiên là ra cửa đó là một cơ hội tốt đẹp để nói chuyện với mọi người về một số công việc chúng tôi đang làm. Có rất nhiều quan tâm trong tình cảm, xu hướng, xã hội và đồ thị phân tích slide (9 và 10). Tôi sẽ viết về những người trong một bài riêng biệt, nhưng muốn có được trình bày cho những người đã được hỏi về nó.

Có gì khác nhau về thời gian thực và xã hội tìm kiếm - Hyun Joong Slides Đối với SES Chicago 09 Tháng 12

Có gì khác nhau về thời gian thực và xã hội tìm kiếm - Hyun Joong Slides Đối với SES Chicago 09 Tháng 12 - Presentation Transcript

  1. Có gì khác nhau về thời gian thực và tìm kiếm xã hội?
    Hồ John Lee
    Hiệu trưởng Giám đốc chương trình
    Bing Search Xã hội
    Chiến lược Công cụ tìm kiếm
    Chicago - 07 Tháng 12 2009
  2. Real Time Search tốt cho những gì, Dù sao?
  3. Twitter là Great cho Xem Các tu hoảng loạn Unfold Sống
    ... Hoặc tìm kiếm bóng bay
    http://xkcd.com/574/
  4. Một số đặc điểm của Twitter / phương tiện truyền thông xã hội
    Tức thì, tình cảm, Ngắn gọn
    Không phải luôn luôn chính xác
    Cảm xúc, phản ứng, ấn tượng
    Bối cảnh thường xuyên là điều cần thiết để xác định ý nghĩa
    Cử chỉ -user, #hashtag, RT, yêu thích, sau
    Cộng đồng tự tổ chức của sự chú ý và thẩm quyền
    Nội dung sau sự chú ý
    Người ta nói về những gì người khác đang nói về
    Quan sát và bình luận từ khắp mọi nơi
    Nếu không có nội dung, bạn có thể yêu cầu một số
    Đầu cực đoan và bảo hiểm đuôi
    Thấp phù hợp "tiếng ồn" có thể trở thành "tín hiệu" trong tổng hợp
  5. Sản phẩm hoặc thương hiệu của bạn đột nhiên có thể là ở trung tâm của một cuộc trò chuyện rất lớn
    Tiger Woods
    Balloon Boy
    Breaking Câu chuyện
    Câu chuyện dai dẳng
    Câu chuyện lớn
    Câu chuyện lớn hơn
  6. Một số đặc điểm của thời gian thực / Social Search
    • Thời gian thực và tìm kiếm xã hội là chất lượng khác nhau từ tìm kiếm web truyền thống
    • Sự khác biệt trong bảng xếp hạng, phù hợp, sử dụng mô hình
    • Đồ thị xã hội, hành vi người dùng, vị trí, sự kiện tương quan và tín hiệu đầu vào khác
    • Tìm kiếm thời gian thực thường về phát hiện, không phải tìm kiếm cho mỗi gia nhập
    • "Là những gì mọi người nói về", tiếp theo là "mọi người đang nói gì về"
    • Lên trên thời gian thực và kết quả tìm kiếm xã hội thường sẽ khác với kết quả tìm kiếm web hàng đầu
  7. Bing Twitter Tìm kiếm trong nháy mắt
    Lên trên Tweets
    Liên kết Top chung
    Tweets / Niềm tin cho mỗi liên kết
    Người lớn bộ lọc / Spam; Tweets / Liên kết xếp hạng và liên quan
  8. Bing mùa thu năm 2009: Twitter dọc, Tin tức, MSN, Maps
    MSN địa phương bản
    Trang 2: Tweets hay Liên kết
    Trang 1: Tweets & Liên kết
    Twitter trả lời về Tin tức SERP
    MSN nóng chủ đề
  9. Chủ đề phạm vi / tâm lý, khối lượng, phân tích xu hướng
    Là những gì các tỷ lệ cơ bản của đề cập đến / tình cảm mỗi đơn vị thời gian?
    Những thay đổi trong dòng chảy sự chú ý xung quanh một chủ đề, vị trí, chủ đề
    Bạn cho tín hiệu tương quan từ nhiều nguồn
    Xem xét tính phù hợp nguồn và quyền lực cũng
  10. Phân tích đồ thị cho phù hợp và xếp hạng
    Chiến dịch tiếp thị Spam
    Cộng đồng tự nhiên kết nối
    Cộng đồng spam được đánh giá cao có thể nhìn thấy - không là một phần của một!
  11. Bing Maps Twitter Demo
  12. Để vượt lên trên tiếng ồn, có nhiều hơn để làm như tìm kiếm được xã hội hơn
    Plus ...
  13. Cảm ơn Bạn
    Hồ John Lee
    hojohn. lee @ microsoft.com
    twitter.com/hjl
Phiên họp đã được kiểm duyệt bởi Barbara Coll , Giám đốc điều hành, WebMama.com Inc., với tham luận viên Bill Fischer , đồng sáng lập và Giám đốc, Workdigital, Ltd., Rob Walk , Giám đốc, NovaRising, Nathan Stoll , đồng sáng lập, Aardvark, và Hồ John Lee , Hiệu trưởng Giám đốc chương trình, xã hội và Real Time Search, Microsoft Bing.

Slide của tôi từ Tìm kiếm Bảng điều chỉnh thời gian thực tại SES Chicago tuần trước

Mặc dù tìm kiếm thời gian thực là khá mới, như chúng ta kết thúc năm 2009, khả năng chỉ số và kết quả tìm kiếm mới đang nhanh chóng trở thành một loại hàng hóa, với Bing, khởi động khác nhau, và bây giờ tất cả các trạng thái tích hợp Google nguồn cấp dữ liệu từ các dịch vụ mạng xã hội. Các tập tiếp theo của những thách thức trong năm 2010 sẽ vào khoảng cung cấp phù hợp tốt hơn, khám phá thông tin, thăm dò và tìm kiếm chủ đề cho xã hội, sử dụng tín hiệu từ hành vi động của người sử dụng và tương tác với các đồ thị xã hội và chủ đề.

Tôi đã đưa ra một cuộc trò chuyện ngắn về thời gian thực và tìm kiếm xã hội cho một bảng điều khiển ở SES Chicago tuần trước. Tôi đã bước xuống trong vài tháng qua làm việc trên Bing Twitter Search, vậy bây giờ mà khởi động đầu tiên là ra cửa đó là một cơ hội tốt đẹp để nói chuyện với mọi người về một số công việc chúng tôi đang làm. Có rất nhiều quan tâm trong tình cảm, xu hướng, xã hội và đồ thị phân tích slide (9 và 10). Tôi sẽ viết về những người trong một bài riêng biệt, nhưng muốn có được trình bày cho những người đã được hỏi về nó.

Có gì khác nhau về thời gian thực và xã hội tìm kiếm - Hyun Joong Slides Đối với SES Chicago 09 Tháng 12

Có gì khác nhau về thời gian thực và xã hội tìm kiếm - Hyun Joong Slides Đối với SES Chicago 09 Tháng 12 - Presentation Transcript

  1. Có gì khác nhau về thời gian thực và tìm kiếm xã hội?
    Hồ John Lee
    Hiệu trưởng Giám đốc chương trình
    Bing Search Xã hội
    Chiến lược Công cụ tìm kiếm
    Chicago - 07 Tháng 12 2009
  2. Real Time Search tốt cho những gì, Dù sao?
  3. Twitter là Great cho Xem Các tu hoảng loạn Unfold Sống
    ... Hoặc tìm kiếm bóng bay
    http://xkcd.com/574/
  4. Một số đặc điểm của Twitter / phương tiện truyền thông xã hội
    Tức thì, tình cảm, Ngắn gọn
    Không phải luôn luôn chính xác
    Cảm xúc, phản ứng, ấn tượng
    Bối cảnh thường xuyên là điều cần thiết để xác định ý nghĩa
    Cử chỉ -user, #hashtag, RT, yêu thích, sau
    Cộng đồng tự tổ chức của sự chú ý và thẩm quyền
    Nội dung sau sự chú ý
    Người ta nói về những gì người khác đang nói về
    Quan sát và bình luận từ khắp mọi nơi
    Nếu không có nội dung, bạn có thể yêu cầu một số
    Đầu cực đoan và bảo hiểm đuôi
    Thấp phù hợp "tiếng ồn" có thể trở thành "tín hiệu" trong tổng hợp
  5. Sản phẩm hoặc thương hiệu của bạn đột nhiên có thể là ở trung tâm của một cuộc trò chuyện rất lớn
    Tiger Woods
    Balloon Boy
    Breaking Câu chuyện
    Câu chuyện dai dẳng
    Câu chuyện lớn
    Câu chuyện lớn hơn
  6. Một số đặc điểm của thời gian thực / Social Search
    • Thời gian thực và tìm kiếm xã hội là chất lượng khác nhau từ tìm kiếm web truyền thống
    • Sự khác biệt trong bảng xếp hạng, phù hợp, sử dụng mô hình
    • Đồ thị xã hội, hành vi người dùng, vị trí, sự kiện tương quan và tín hiệu đầu vào khác
    • Tìm kiếm thời gian thực thường về phát hiện, không phải tìm kiếm cho mỗi gia nhập
    • "Là những gì mọi người nói về", tiếp theo là "mọi người đang nói gì về"
    • Lên trên thời gian thực và kết quả tìm kiếm xã hội thường sẽ khác với kết quả tìm kiếm web hàng đầu
  7. Bing Twitter Tìm kiếm trong nháy mắt
    Lên trên Tweets
    Liên kết Top chung
    Tweets / Niềm tin cho mỗi liên kết
    Người lớn bộ lọc / Spam; Tweets / Liên kết xếp hạng và liên quan
  8. Bing mùa thu năm 2009: Twitter dọc, Tin tức, MSN, Maps
    MSN địa phương bản
    Trang 2: Tweets hay Liên kết
    Trang 1: Tweets & Liên kết
    Twitter trả lời về Tin tức SERP
    MSN nóng chủ đề
  9. Chủ đề phạm vi / tâm lý, khối lượng, phân tích xu hướng
    Là những gì các tỷ lệ cơ bản của đề cập đến / tình cảm mỗi đơn vị thời gian?
    Những thay đổi trong dòng chảy sự chú ý xung quanh một chủ đề, vị trí, chủ đề
    Bạn cho tín hiệu tương quan từ nhiều nguồn
    Xem xét tính phù hợp nguồn và quyền lực cũng
  10. Phân tích đồ thị cho phù hợp và xếp hạng
    Chiến dịch tiếp thị Spam
    Cộng đồng tự nhiên kết nối
    Cộng đồng spam được đánh giá cao có thể nhìn thấy - không là một phần của một!
  11. Bing Maps Twitter Demo
  12. Để vượt lên trên tiếng ồn, có nhiều hơn để làm như tìm kiếm được xã hội hơn
    Plus ...
  13. Cảm ơn Bạn
    Hồ John Lee
    hojohn. lee @ microsoft.com
    twitter.com/hjl
Phiên họp đã được kiểm duyệt bởi Barbara Coll , Giám đốc điều hành, WebMama.com Inc., với tham luận viên Bill Fischer , đồng sáng lập và Giám đốc, Workdigital, Ltd., Rob Walk , Giám đốc, NovaRising, Nathan Stoll , đồng sáng lập, Aardvark, và Hồ John Lee , Hiệu trưởng Giám đốc chương trình, xã hội và Real Time Search, Microsoft Bing.
Page 3 of 78 1 2 3 4 5 ... 10 20 30 ... Last »