使用Firefox 留言請注意:

由於某些未知原因,使用火狐 Firefox瀏覽器可能無法留言。 請嘗試下載Google Chrome 瀏覽器來留言 blogspot 的部落。

2014年8月7日星期四

网络键连资料 Linked data 对你的行业有什么用?


网络键连资料linked data , 看起来高深莫测,看起来是很【新】的电脑术语。
其实每个上网的人,就肯定接触到它 - 网页链接。 (上面的linked data 就包含着链接)。

Linked data 不是新鲜事, 它是网页浏览最首要的目的,也是最终的目的。20年前,  Tim Berners Lee 带出Web page 这个主意,就是为了让资料链接更容易, 让使用者可以从页面链接到自己要的资料。

不过,要从恒河沙数的网页找出特定的资料不容易,搜索应用程序就应运而生,现在谷歌搜索是我们常用的。 不过那不过是到了linked data 门口而已。 

比如说, 我要找 “所有法国餐的包含奶油的食谱名字”, 谷歌也只能收集有“法国餐, 奶油,食谱” 词汇的网页, 而我自己就要从零散的资料, 自己一一检查,列出食谱。而且那些谷歌给的网页也可能含有垃圾资料,浪费了时间。

又比如说, 要找一系列的未知的各国酸性水果食谱,来做个食物主题,你试试去谷歌“各国酸性水果食谱”,肯定踢铁板。 

其实不能怪谷歌。归根结底,许多网页都没建立基本的词汇链接。写文章的人,可不会一一列出每个字词去有关的资料库。所谓的“tag"(标签) ,能做的也是有限度的。 

起先的做法, 是从一个你认为收集最多某些资料的中央资料库出发。 比如说Wikipedia.  然后结合谷歌搜索。 拿主题酸性水果做例子, 比如在Google 里头做这样的搜索
 sour fruit site:wikiepdia.org

不过整理方面还是有问题的, 比如说你可不想吃到有毒的酸性水果,要如何在搜索的时候剔除也是不简单的技术问题。 
这几年内,语意网(Semantic Web - 1998  )已经开始具体化了。不需要有高深的电脑操作知识,只要你懂一些工具的概念,就可以开始开始做更精简的资料搜索。语意网的基本架构,就是让重要的词汇和意义链接起来。 

比如说“苹果” , 就有许多意义跟随 : 
  • 科学学名,不同语言的叫法
  • 种植方法,收成的资料,每个品种的资料链接管理等等, 
  • 公司名字
  • 关联的食谱
  • 化学分子的分列
  • 味道的关联
  • 艺术文学的关联
  • 词汇的关联
  • 还有其他

当语意网的词汇被架构起来, 那使用语意网工具,就可以更简单做出特定的资料搜索,甚至可以探讨其他可能性。 

比如说 “当季节可以找到的酸性水果", 里头就包括了
  • 搜索时候的月份, 水果生长的季节资料
  • 必须是酸性的
  • 必须是无毒的
这个例子暂时无法实现,因为我不懂有什么食谱网页,有做某些特定味道的架构规划,而且做架构改变也需要拥有建立架构的知识。

不过做有限度的研究探讨的架构也不是没有, 比如说wikipedia , 拿 Carbonara 来说, 去wikipedia 的意义架构dbpedia :




可以看出来,Carbonara 的食谱和其他资料已经被架构来了。

如果一个人手上有胡椒,乳酪,火腿,鸡蛋和麵条, 除了做他知道的Carbonara 外, 也可以用着架构,去搜索任何使用同样材料的食物。 而且从Carbonara 的架构,我们知道这是主食,是从Lazio 这个地区发展出来的。 接下去的种种,就看个人要如何使这些【额外】的知识资讯去研究创新了。

信息深入探讨还不过是Linked data 其中一项功能而已。如何从中创新,就看各人修为了。 

----------------------------
有兴趣知道多一点的,可以上MOOC 课程。 (中等难度,如果你是IT 或是数学工作者的话。)

----------------------------
最近不知道是否中年危机感,很想转码头去教书。(当然是教信息科技)。 不过有那间中小学要做“真正的电脑课“呀?

1 条评论:

  1. 哈哈, 我的电脑知识太有限, 看到我头也大了。。
    看来, 我要多多来访, 学习多点电脑术语。

    回复删除