0
雷鋒網 AI 科技評論消息:日前,清華大學副教授、Arnetminer創始人唐杰在微博公開表示AMiner將發布計算機領域的專業知識圖譜Science Knowledge Graph (SciKG)。
據其介紹,
這個計算機領域的知識圖譜包含1萬個知識概念、概念關系以及概念定義,20萬專家信息(專家和知識概念對應)以及50萬相關論文。這個數據可以用來做一些領域信息理解,信息推薦和檢索。

雷鋒網 AI 科技評論了解到,AMiner官網目前已經更新了該數據集的下載通道。
從官網可以看到相關介紹,
SciKG是一個豐富的知識圖譜,用于科學領域(目前包括計算機科學(CS)),由概念、專家和論文組成。概念和概念之間的關系是從ACM計算分類系統中提取出來的,每個概念的定義都從維基等數據集中進行了補充。
數據集中包括每個專家的職位、隸屬機構、研究興趣,以及與AMiner的鏈接(如果有必要,還可以獲得更多信息),每一篇論文包括標題、作者、摘要、出版機構和年份等元數據信息。
數據集的統計結果如下圖,包括908個概念,20多萬條專家信息,50多萬篇出版論文,9668個關鍵詞。

此外,在數據集中,每個對象都是JSON格式 。關鍵詞的數據結構如下表:

示例如下:

另外,官網上同時也強調,該數據集能助于更好地理解計算機科學領域的動態和發展,幫助搜索和推薦CS領域的專家和論文。
詳細信息可在https://aminer.org/scikg查看。
雷鋒網 AI 科技評論
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。