近期,天眼查举行了媒体沟通会。天眼查CEO柳超向媒体展示了天眼查的应用场景,同时,重点介绍了面向消费者的网页版和专业版产品。在发布会后的专访环节,柳超向腾讯科技首度披露了天眼查的核心技术——“天眼评分”、“去重名”技术的原理以及从学界到商界的种种感悟。

 

从外表来看,柳超和大多数深研计算机的科学家一样,戴着眼镜,文质彬彬;而不一样的是,他的眼神中,除了有一种对科学的执着和坚毅,还有一种类似商人的睿智和犀利。

1999年,柳超以河南省理科第一名的成绩进入北京大学。2003年从北京大学计算机系毕业之后,柳超来到全美计算机专业前列的伊利诺伊大学香槟分校师从大数据领域著名华人教授韩家炜。在竞争激烈的北美学术圈,柳超发表了3 本英文专著、5篇国际期刊文章,以及30余篇国际一流学术会议文章,共计1300+次独立引用,在短短的三年半时间内便拿到了硕士和博士学位。毕业后,柳超选择去工业界的研究机构,先后在美国 微软 研究院、腾讯科技、搜狗科技担任研究经理、首席科学家等职务。十多年的科研经历,让柳超对“科学”两个字情有独钟,即使现在是创业者身份,柳超依旧愿意“以科学的方法来思考商业的逻辑”。

在大数据时代,人们往往认为只有非公开的大数据才有价值,其实,数据的价值绝不在于数据的稀缺性,而是在于其挖掘后的结论的意义。基于这样的理念,“天眼查”应运而生。

天眼查是一个关系发现平台,旗下有四款不同层级的产品。天眼查网页版是国内唯一一个无需任何注册、登录、验证码的企业信息查询系统,独有的“去重名”技术和“天眼评分”,提高了搜索的准确度和效率,并将永久免费。天眼查专业版将“关系发现”变得无比简单,只要用户输入相关信息,并添加到查关系页面,主体之间的所有关系便能以一种可视化的方式直观呈现,帮助用户发现更多隐藏在背后的商业利益关系。

公开大数据的新奥秘

公开数据的价值最易被人忽略! 天眼查CEO柳超-Wxjback|Crab And Lion

(天眼查关系图示例)

提问:为什么选择做数据挖掘这个事情?

柳超:大数据火了这么多年,其实面临一个困境,到底什么样的数据我们才能对它进行挖掘并且产生价值。这就有两方面,一种是公开的数据,你有我有大家都有,你去挖掘别人也去挖掘,在数据源上没有任何竞争力。另外一个就是大型企业,不论是传统行业还是互联网行业,由于自身的业务积累有很多私有数据,这些私有数据是不会拿出来,它们自身可以做挖掘,外边很难说挖掘一下你的数据,那些叫做特权数据,就是私有数据。高价值数据,业务数据,私有数据看不到,公开数据挖掘又怕没有核心竞争力,所以大数据搞得比较虚。我们觉得公开数据大有所为,不敢去做是因为实力没有达到,做不出来有壁垒的事情,但我们现在到了能做出有壁垒事情的水平,所以我们才有底气这么说。

提问:你说天眼查上的信息是互联网上公开的信息,能不能说具体一点,除了工商登记信息,还有一些其他的信息吗?

柳超:我说的是公开,但没有说具体的来源,政府上有一些公开的公示信息,例如:最高人民法院的裁判文书、企业网站备案信息等,这都是国家机关出来的公开信息。公开信息并不是说只有国家公示的才是公开信息,新闻媒体上的新闻那也是公开的信息。它虽然不是政府的但是也是公开的。

提问:那以后咱们会有涉及到私有数据方面的一些产品吗?

柳超:我们把数据和技术的关系分得很清楚,我们产品本身是不涉及私有数据的。我们目前已经有很多跟企业合作的项目,在这些具体的项目中可能会涉及到客户的私有数据,但是这些私有数据依旧是在客户的内部机房,用物理隔离起来。我们提供技术服务,并且把我们公开数据引入过去。

提问:我刚刚试用了一下天眼查专业版,点击查看共花费了7块多。一开始,有些信息是显示的,有些是隐藏的,这是怎么设置的?哪些关系被隐藏的?

柳超:这个机制像打游戏一样的,哪些东西是比较重要的,大家比较好奇的,我们就选择性隐藏。举个例子如果出来上面几家公司出来了三个关联的人和三个关联的公司,您认为您是想看人还是想看公司?

提问:可能具体问题需要具体分析。如果被隐藏掉的是高价值的东西,那怎么定义高价值的?

柳超:这个说起来很复杂的。什么叫做有用的信息?就是给出一个系统,如果这个信息能够最大地降低这个系统的熵,那这个信息是最有价值的。这个背后有一套复杂的深度学习模型在里面。

提问:你刚才说到,天眼查的“去重名”技术和“天眼评分”是独创的,那天眼查的“去重名”是怎么运作的?

柳超:比如说我,我叫柳超。中国有很多柳超,也有很多公司关联到柳超这个名字,我们要把我这个柳超和其他柳超去区分开。我们会根据通常合作紧密的几个人,来看把他们当作一个“社区”,这其实是一个“社区发现”的问题。当然,他们关联到的人每一个也有重叠,我们要再他们分开起来。

提问:那天眼评分是根据哪些方面进行评分的?

柳超:天眼评分参考的维度非常多,背后有一套深度学习模型,这个模型是可解释的。你觉得一家公司诉讼多,这个分应该高还是低?

提问:应该是高。

柳超:有人持反对意见吗?为什么诉讼多还高。这个其实要分别的对待,你一个小企业有那么多的诉讼,跟一家大企业有很多诉讼效果不一样的。所以诉讼是加分项还是减分项,这个背后是一套复杂的深度学习原理在里面。

提问:天眼查专业版现在会出图谱,后续会有更多相关的资料和底稿拿出来,来代替律师等专业人士吗?

柳超:这个要回到“人、技术、数据”三位一体的理念,我们不会替代律师,律师是非常专业的职业,我们擅长的是技术,用技术来帮专业人士做更多的事情,例如咱们律师发现更多的线索,要查找一些关联公司实际控制人,天眼查就是要把咱们花费很长多时间的事情用很短的时间解决了。具体到某一个家公司,经营状况、纳税帐户,以及帐目走得是不是清晰,这些不是公开数据,我们专业版不能提供,这些事情需要咱们专业人士深入调查,我们只是把这张网给铺开帮助专业人士发现更多的线索,这是我们技术提供的服务,我们不会把那一摞特别厚的东西做了。

To B, To C,不是To VC

 

提问:你说天眼查面向To C、To B共有四个版本,定制版或者其他版本还会有收费的吗?

柳超:To B肯定收费的,我们要接受市场用户考验。我们不是To VC,是To B和To C,我们不是以吸引投资为最终目的,我们有一套自己的可行的盈利模式。

提问:有没有想过在C端盈利?

柳超:网页版这一块我们是免费的,但是专业版,提供的是增值服务,查询出来的东西很有价值,所以是我们的收费点。专业版关于企业查询类的东西都是免费的不需要注册的。

提问:什么样的人会用网页版,什么样的人会用专业版呢?

柳超:各种各样的人都会用网页版。你要找工作需要看看招聘方是否正规;有一些小孩子来北京、上海打工,在家父母会查一下这家公司看看这家公司怎么样。可能对于老人来说可能不知道什么是商务服务业,什么是续存,但是他看得懂分数。这是一个最直观的感觉,高分就是好公司,这是天眼查的意义。高端精英人士用的是专业版,精英背后都是企业,律师背后是律所, 金融界 精英最后是投资机构。

提问:目前天眼查的对B端产品主要应用在哪些领域?

柳超:在To B的产品系列中,标准化的产品——企业版的就最大应用范围就是金融行业,做风控、审计,需要查关联交易,这些都是逐步探索的过程,所以企业版那边最多的是金融行业以及大的律所。定制版更多是融合客户自有的数据,对很多行业的企业来说,他们最有价值的数据是他们自己的业务数据,就是私有数据。我们把它们组织成一张网,所有数据融合在一起后会有更多的接,进而产生更大的价值。定制版着眼点就是把企业业务数据和私有数据结合,更好的服务他本身的业务。垂直领域其实还是属于金融、律师、咨询等领域。

提问:那媒体的应用场景呢?

柳超:媒体其实用专业版更方便,现在国内一些最顶尖的媒体机构都在用我们专业版。

提问:我们注意到现在这些创投媒体也在做数据方面的项目?请问天眼查和他们有什么区别?

柳超:这个行业越多人来做越好,这样大家都可以合作共赢,我们一直都是以这种开放的态度去做的。我们是中国唯一一个不用注册不用登录也没有验证码的企业信息平台,我们受益于政府的数据公开,我们同样以开放态度服务我们的用户。我是从腾讯出来的,我非常敬佩 马化腾 ( 微博 )先生的一句话:“我们走开放之路,开放不仅是一种态度,更是一种能力。”

提问:就你在对大数据观察理解上,你认为大数据在商业范围内还有哪些更多的应用?

柳超:这个问题比较泛,我就从公司层面说起。我们接触到的很多大客户,他们认为最大的商业价值在于他们自有数据和公开数据的结合。好比一个公司是造汽车的,它需要螺丝,它有很多供应链的信息,做同样一个螺丝好几家都能做,到底用哪一家,有很多交易数据信息,再看看外部对公司的评价。这家公司口碑怎么样?是不是都是一个集团?这部分需要借助外部的信息来做。大数据在商业范围内的更多的应用场景,需要借助外部数据和内部数据结合。

用科学家的精神创业

 

提问:是什么让你想着从搜狗出来做“天眼查”这样的产品?

柳超:说起来话会稍微长一些,我以前没有想过做“天眼查”这个名字的项目,但是做这个事情是早就有这种想法。如果有兴趣可以看一下我在2011年有一篇学术论文,那时候我还在美国微软研究院。当时,我带领一个来自CMU(卡耐基梅隆大学)的实习生做项目,是有关于美国一个网站TechCrush的,这个网站在中国比较类似应该是IT桔子。它里面有一个关于初创企业的数据,类似于工商信息,里面有关联的人,投资机构等。我们当时做的是,能不能通过公司之间人实体之间关系的投资结构以及新闻上的信息,预测哪些公司得到投资,如果得到投资会得到谁的投资?当时理念就是说我们处在一个由人组成的社会,所以很多决策在于人,依据这样一个理念做了一个预测模型。这个模型效果很不错的,当时发了几篇文章,当时就把这个当做常规的学术论文处理了,后来又过了几个月,美国的《商业周刊》转载这篇学术论文并且做了评论,说这个是很有趣的工作。当时我看了这个很受触动,当时我就开始思索这个事情是不是在中国可以做。我2012年回国,但是当时很多数据还没有开始公开,所以就先在腾讯、搜狗工作了几年,主要就先学习了一些先进的中国互联网行业的经验。后来觉得时机成熟了,就下定决心开始出来做天眼查。与之前的那篇论文相比,虽然做的事情不一样,但是里面结构和思路是一样的,组建人、企业这样一个关系网来看清这个世界。

提问:创业过程中有没有觉得一些困难?

柳超:困难肯定有的。我觉得主要是人才问题,我们当时创业的时候五个人,做出一个非常初级的演示案例,就可以吸引到投资人的赏识,一开始估值两亿。但是,现在阶段不一样,公司在快速发展,我们现在面临很大问题是怎么样在各个方向都能招到专业的并且比我更牛的人?我在做大数据方面属于专家,但是我在运营、市场、销售甚至在技术落地等方面都面临很大挑战。我希望把领域扩大,从而能够吸引各方面的人才来一起把这个事情做成。

提问:你对天眼查未来有什么规划预期?

柳超:未来预期成为大数据标杆性高科技企业。一直以来,很多人问大数据是什么?大意味着什么?我觉得大并不是意味着有多大硬盘多大集群能够存储,大在于影响力。有些数据可能天生比较稀缺,但是从稀缺性并不能变现出来多大的影响力。我经过十几年数据挖掘的训练,具有一个较为严谨的科学思维,知道在大数据里面什么是可用的,什么是不能做的,并且也有相关实际经验,所以我相信我们会跟其他很多大数据企业是不同的气质。现在我也在很多国际顶级学术委员会担任委员,可以借助以前在学术上的积累来知晓现在国际上数据挖掘的最前沿研究是什么样的。当然,学界也很需要企业的相关实践来验证学术发现,目前我们也在接洽一些学术研究机构,希望能够把我们的一些业界实践能够反馈给学界。今后,我们将会以更加开放的心态来去做这个事业。

提问:最近有没有新一轮融资计划?

柳超:现在有很多投资者找到我们,觉得以前没有听说过,甚至很多投资人都说,你们天使轮融了那么多,怎么不发新闻呢?天眼查一直在踏踏实实做事情,我们希望是能够把产品和模式都探索清楚了,我们再来做推广。后续在融资方面,如果有什么消息,我们会第一时间通知大家。