2010年3月2日星期二

電腦玩物

電腦玩物


Topsy 依據傳播影響優化Twitter即時搜尋排序,中文查詢優異

Posted: 02 Mar 2010 07:19 AM PST


topsy-01 (by 異塵行者)

搜尋Twitter上的用戶訊息是當我們需要研究資料、評比心得時一個很有用的方法,就如同我之前在「你可以不用 Twitter ,但不可不知如何挖掘 Twitter」一文中所提到的,即使你對於微網誌的互動發表沒有興趣,但你也不應該錯過善用Twitter這類微網誌資料庫所能帶來的好處。

為什麼像是Google、微軟Bing這類傳統搜尋引擎都要搶著在已有搜尋基礎上加入「即時搜尋(Real-Time Search)」?這個大家所賦予的名稱是要表達「搜尋速度很即時」的意思嗎?我覺得不是,因為以Google來說,我前一分鐘所寫的部落格文章,基本上下一分鐘就已經被Google收錄了,難道Google的檢索速度還不夠即時嗎?所以「Real-Time」這裡要表達的不是搜尋速度的即時,而是指「搜尋內容」所體現的一種「真實時間」,一種「資訊傳播時的動態風景」。

如果說以前用傳統搜尋引擎查詢關鍵字時我們找到的是一堆官方網站、重量級報導,那麼現在使用「即時搜尋」功能所要找到的就是「最近(當下時間影響)」「大家(人與人的影響)」對於關鍵字的各種批評指教,目的是要找出「正在流動中的資訊」、「正在變化中的價值」。

  • Topsy:http://topsy.com/
  • 支援中文關鍵字與內容搜尋,查詢中文的結果優化官方版Twitter Search

 

Topsy:新網路時代的資訊流動影響力,中文支援完善

之前我也推薦過一款Twitter搜尋引擎:「Twitter Search 關鍵字搜尋教學,即時追蹤Twitter新鮮話題(最新:Twitter官方頁面正式內建其關鍵字搜索、訂閱功能!)」。不過今天我要推薦的Topsy有更為優異的中文搜尋結果,而且更重要的是Topsy有很不錯的排序過濾機制

這個針對Twitter內容的即時搜尋引擎:「Topsy」,其實它的名稱就隱喻這種資訊流動。我猜「Topsy」這個詞是源於「grew like Topsy」,根據維基百科的解釋為:「這個短語被用於比喻一種自生自長、放任自流的生存方式;在後來的某些時候,它還被用於形容高速的成長或發展。」。Topsy在官網提到,這款獨特搜尋引擎的理念認為,網路不只是文本內容的堆積而已,事實上網路的本質更像是一種「對話的流動(a stream of conversations)」,而Topsy正是要把這種人與人之間如何透過網路「互相影響」的特色發揮出來。

於是Topsy除了針對Twitter內容進行檢索外,還加入了一個以「影響力」為基準的搜尋結果優化機制,或許可以想像成類似Google的搜尋排序,只是Topsy這邊改成依照用戶影響力的趨向,以及該則訊息傳播力度來重新優化Twitter搜尋結果

topsy-02 (by 異塵行者)

 

Topsy用時間性與影響力自動優化Twitter搜尋結果

來到Topsy網站,直接輸入關鍵字就可以開始進行搜尋,除了可以支援中文關鍵字外,值得注意的是Topsy這邊排序的兩大依據就是「時間性」與「影響力」。

  • 時間性:Topsy會依據關鍵字的熱門時間來優化排序結果。例如搜尋「燈會」,因為前幾天台灣剛剛有元宵燈會,所以Topsy會挑選「本週」內的熱門話題討論來排序在前端。但是如果你搜尋「google」,因為每天都有大量相關話題,所以Topsy會以「今日」作為優化排序的範圍依據。
  • 影響力:Topsy會依據某一則訊息、某一個網址連結被傳播、推送的次數來調整排序結果;而且還會加入「高影響力用戶」這個變數。

我們也可以在Topsy搜尋結果的左方,調整搜尋排序的時間範圍(All, Month, Week, Day, Hour)。而預設情況會根據「Relevance(關聯性,其實就是前面所說的影響力)」來將可能更好的結果排序在前面,但是你也可以調整成「Timeline」完全採用時間前後來排序。

topsy-04 (by 異塵行者)

Topsy的排序機制,提供給我們一個「更有效」的查詢結果,我們可以獲得某個關鍵字的熱門討論串,也可以獲得相關的次數統計與討論內容。

點進某則討論串後,就可以看到所有Twitter用戶針對該話題或網頁的推送情形。其中我們可以看到有些用戶被標上「Highly Influential(高影響力)」,這個標籤來自於該用戶的跟隨人數和發表訊息被傳播的廣度,具有「高影響力」標籤的用戶以後推送的訊息也會被Topsy納入搜尋結果加權計算。

topsy-07 (by 異塵行者)

 

三種查詢結果呈現方式:網頁、圖片、Twitter訊息

Topsy雖然是以Twitter內容為資料來源,但是Topsy的定位其實不僅僅是「Twitter搜尋」而已(未來可能還會加入其他社群資料庫),Topsy是把自己看成另外一種網路搜尋方式

所以在Topsy的搜尋結果中會有三種呈現方式,而預設的第一種方式是「Web」,在這個模式中大多數結果呈現的是「網頁連結」的形式,也就是提取出大家都在Twitter中推薦哪些網頁,而你就可以透過Topsy找到關鍵字相關的網頁連結。

topsy-09 (by 異塵行者)

第二種方式則是「Photos」,提取出大家在Twitter中推薦了哪些圖片連結,讓你用關鍵字直接找出這些圖片內容。

topsy-05 (by 異塵行者)

第三種方式則是「Tweets」,這才是呈現出原本的Twitter訊息模式,讓你看看某個關鍵字話題的對話討論情形。

topsy-08 (by 異塵行者)

從Topsy預設先顯示「web」模式,幫我們過濾出Twitter裡正在被傳播的網頁連結來看,其實Topsy是相信在社群資訊流動中可以提取出有用的網站,「人的互動結果」可以呈現出機器爬蟲所不能達到的那一面。

 

Topsy其他小工具:

  • 查詢某個網頁的傳播程度:

接下來補充介紹Topsy上一些不錯的小功能。例如我們除了輸入關鍵字,也可以直接在Topsy輸入某個網頁網址(例如你部落格中某篇文章的網址),這樣一來Topsy就會幫你查出這個網頁在Twitter上的傳播程度,你可以看到有哪些人推薦、討論了這篇文章,哪些有影響力的用戶推薦了它(而且這個功能可以幫你搜尋解析Twitter上大多數的短網址,還原成原本的網址連結)。

你還可以到這個網頁獲得便於立刻進行查詢目前瀏覽頁面的Bookmarklet工具。

topsy-14 (by 異塵行者)

 

  • 訂閱追蹤某個關鍵字:

每個搜尋都會提供RSS訂閱功能,你可以透過這個小工具來追蹤一些感興趣的關鍵字,而且別忘了,Topsy是提取整合出「被大家推薦的網頁」來讓你訂閱,而非是零散的Twitter訊息。

所以我們可以透過Topsy的訂閱功能,即時追蹤有哪些新的文章在Twitter上被推薦。

topsy-10 (by 異塵行者)

 

  • 部落格小工具:

Topsy也有部落格按鈕工具,提供一個把你部落格文章推薦到Twitter的按鈕,還可以計算你這篇文章在Twitter上被推送了多少次。

topsy-16 (by 異塵行者)

 

  • 小結:

「即時搜尋」是否有用?還是只會找到一些雜亂無章的資訊碎屑?我覺得這是一個必須實際體驗才能找到解答的問題,但一開始或許也是一個觀念的問題。如果你覺得素人永遠不可能講出比專家更有用的話語,那麼你應該永遠也無法認同即時搜尋的可用性;但是如果你相信在家常對話、街談巷議之間就存在著真理的靈光,那麼你就能體會即時搜尋所能帶來的刺激與樂趣。

而Topsy優秀之處在於,它不只是一個Twitter內容搜尋引擎而已,更重要的是Topsy使用了自己的影響力加權計算公式,幫你排序搜尋結果,而且可以幫你提取出「大家推薦的網頁」、「大家推薦的圖片」,把原本分散的Twitter訊息整合成一個共同話題。我覺得或許以後我就真的會拿Topsy當做我的Twitter搜尋引擎了吧!

没有评论:

发表评论