2012年5月23日 星期三

Google knowledge graph (知識結構圖) 是什麼?


Google knowledge graph (知識結構圖) 是什麼?

Knowledge Graph (知識結構圖)是Google推出的新功能,根據Google在"Introducing the Knowledge Graph"的說法,為了讓使用者瞭解真實的世界以及其間的關係,所以有了這個知識結構圖 ... Knowledge Graph也有人翻譯成~ 「知識圖譜」或是「知識圖表」。

但是還是覺得「知識結構圖」或是「知識關係圖」比較能夠表示這裡Graph的真正意含。

因為「圖譜」已經在許多領域有既定的用法,指的是有系統性分類的圖集,而「圖表」則跟graph意義差更遠。

graph的意義是指: A graph in this context is a collection of "vertices" or "nodes" and a collection of edges that connect pairs of vertices. A graph may be undirected, meaning that there is no distinction between the two vertices associated with each edge, or its edges may be directed from one vertex to another ... 意思就是由「節點」與連接節點的「邊」所組成,具有方向性或是沒有方向性的結構,稱之為graph。

「節點」就是vertices或是nodes,「邊」就是edges。 例如下圖就是一個沒有方向性的graph:

下圖就是一個具有方向性的graph:

為什麼Google要把knowledge跟graph加在一起? 知識具有graph的什麼特性呢?

知識(knowledge)是由訊息(information)而來的,訊息就好像是「節點」,而訊息跟訊息之間的「邊」就是關係,這個關係可能有方向性,也可能沒有方向性。透過「邊」的連接,就讓「節點」與「節點」產生了某些關係。

例如,我們來看看下面的影片介紹

上面的說明中,提到一個例子,我們想知道諾貝爾獎有多少女性得主?

我們就可以從「諾貝爾獎」這個節點出發,找到關係為「得獎者」的節點,並且這個「得獎者」的節點必須是具有「女性」屬性。

而這些資料其實原本就在Google的資料中心,只是沒有解構出「節點」、「邊」、與「屬性」,現在Google推出knowledge graph,表示已經完成了一部分的graph關係,並且可以解析使用者的query (查詢),瞭解使用者到底想問什麼。

例如你搜尋~ tallest building in the world (世界最高的建築),你就可以看到如下的內容,左邊是一般的搜尋結果,右邊是特別整理出來的knowledge panel (知識面板),這個右邊的面板並不是所有的問題查詢都會出現。

但是如果你想查詢~ greatest president in the world (世界最偉大的總統),對不起 ... Google也不知道。

其實這些東西,很早WolframAlpha就已經提供了。

如下圖,如果你一樣搜尋tallest building in the world ... WolframAlpha直接給你答案。

但是如果你問wolframalpha ~ greatest president in the world (世界最偉大的總統),他會告訴你不合邏輯,因為總統是以國家為單位,沒有一個人是世界的總統 ... 哈,還蠻有道理的。

如果你問~ greatest president of United States (美國最偉大的總統),他會避重就輕,只回答你 美國的總統,因為他不知道誰是美國最偉大的總統。

所以許多訊息談到Google knowledge graph,都把這個東西說得太出神入化了,其實Google在這個時間點推出來,有點在提醒大家不要只是一直注意Facebook IPO的味道。

Google在"Introducing the Knowledge Graph: things, not strings"說到,一個完美的搜尋引擎是要真正瞭解你要什麼,並且給你真正想要的東西。意思就是我們Google是一個完美的搜尋引擎,不要只注意Facebook。

但是Google也還算誠實,他也說到"And we can now sometimes help answer your next question before you’ve asked it, because the facts we show are informed by what other people have searched for." 我們『有時候』能夠在你還沒有提問之前,就知道你想問什麼,因為我們呈現給你的事實是其他人已經搜尋過的。

所以,Google能提供的是已經大家經常詢問的問題,或是已經有人整理過的,Google並沒有那麼厲害自己去推理出來各物件的關係,也許以後可能,但是現在只能做到一小部分。

這篇"Google Launches Knowledge Graph To Provide Answers, Not Just Links"也說到,Google knowledge graph是一個big change (大的改變) 沒有錯,但是還不至於讓使用者有振奮的感覺。

Google目前已經對於五億個物件(object)整理出來35億個事實(fact),並且大多屬於下列的類型: 演員、導演、電影、藝術品或是博物館、城市或是國家、島嶼、湖泊、燈塔、音樂專輯或是音樂團體、星球或是太空航空器、雲霄飛車或是摩天大樓、 運動團體 ... 等等,也就是目前Google knowledge graph並不是所以問題都能夠回答。 其實Google knowledge graph的技術,我們在"搜尋引擎的語意趨勢,你準備好了嗎?"就談過了,他就是透過Semantic Web而產生的結果。

還有一個同樣的老問題,為什麼只有英文的內容才有呢? 除了因為中文的複雜度比較高之外,沒有足夠的可結構性資料來產生適當的物件(object)與事實(fact)也是一個問題,還是一個更重要的問題是~ Google是美國的公司。所以,要等到有中文內容的Google knowledge graph,大概還有得等了。

轉載自《SEO關鍵解碼