2009年5月14日星期四

为什么实现基于FreeFormat技术的Web信息提取

在Web信息提取领域工作多年,经历了垂直搜索、社交网络、mashupMEME推荐引擎等多个浪潮,每个浪潮都需要大量的信息提取/页面抓取工具,经过多年的定制开发工作,发现这个领域简直是长青藤,要创办上述网站,需要消耗很大费用用于提取数据。所以从2007年开始开发通用的Web信息提取工具,希望能够帮助互联网领域创业者们将精力集中在核心业务上。

在这个领域工作多年,对此领域的网站经营活动有了一些认识,实际上,上述这些网站服务想靠技术打天下胜算的机会很渺茫,不能因为觉得掌握了信息提取 技术、MEME tracking技术或者其它信息处理技术就能成功运营一个服务,这么多年来看到太多公司起来又趴下,不乏红极一时的新秀,例如,当前垂于挣扎的垂直搜索 领域。实际上,随着互联网的成长,这个领域越来越具有媒体特性了,作为一个程序员,出于对传媒行业的好奇,先后研读了一些媒体经济学和传媒业发展历史的书 籍,受益匪浅。

早在垂直搜索刚刚兴起之时,凭一时热情,也尝试做了一点,发现自己的综合素质还欠缺很多,在企业经营诸方面,例如,资金使用和管理、业务拓展、加盟 合作、营销传播等等,不是一个技术人员能够应付得来的,使我想起了在一个公司任高级职位时总经理所告诫的:你们要学会十个手指头弹钢琴。同时让我联想到一 本书《十年》,感觉到如果能够经营好一个电视板块,那么就有可能经营好一个网站。

步入中年后,感觉到什么才是“不惑”,就是不再怀疑自己的才能了,不再去补短木板了,而是要发挥自己的长木板的作用,短板这块一定要“贵人”相助。 而自己的乐趣就是设计和开发新软件,大可发挥一把,所以将多年互联网工作经验凝聚到当前这个产品中,持续投入几百万资金和2年多时间后,将其免费提供给有 志在互联网领域经营产业的勇士。

产品已经发展到V3版本,除了要解决高效低成本地提取Web信息的问题外,逐渐向语义网络领域发展,希望能够回馈互联网大社区。因此提出了FreeFormat这个概念,期望能够避免分散在互联网行业中的对信息提取的重复投资,以一种社区回馈的方式整理和共享互联网内容

没有评论:

发表评论