除了arXiv,王旭还搞了个知网,嗯,就是中文版的。arXiv的管理同样是交给了GIT的管理委员会,全世界各地都有分布式的景象站,其实这两个网站的后台支撑程序是非常类似的,只是展示层有所区别罢了。
而这种面向全世界的网站,王旭是不会自己攥在手上的,也不会让丑国完全把控,而是弄得跟联合国似的。
总的来说,那就是基本上没人可以彻底斩断arXiv与世界的联系,而且arXiv甚至专门开放了对外的访问自动化接口,可以付费去执行一些类似于爬虫任务之类的下载工作。
因为比较费机器和带宽,所以这個服务是要收费的。
而知网这东西,就比较麻烦了,因为他真的需要和各大版权机构去洽谈,国内的还好说,国际上的就很是有些麻烦,所以这东西至少也得是半商业化运行,否则,那成本可能真的没边了。
而这两个基础设施的建立,其实都是为了未来的人工智能时代做准备的。
王旭前世并没有经历过完整的人工智能时代,而这一世,他又在利用各种手段推进着人工智能时代的到来,这就让他有一些惶恐,前世的人工智能时代,华夏的落后是肉眼可见的。
当然也可能只是路线之争罢了,但国内大部分所谓的人工智能其实本质是人家开源的大模型罢了,王旭不能说了解所有,但确实好多都是如此。
王旭并没有把后世最流行的模型放出去,相反放了相对早期的内容,比如卷积神经网络的模型,现在就是王旭的实验室主要**文的方向。
这东西其实说到底,更适合于图像识别的领域,这是什么车牌识别啊,手写识别啊,人脸识别之类的产品的基础,现在把理论铺平,再经过几年时间的推广和发酵,慢慢地就可以出现在实际的应用领域之中。
当然还有更适合人类语言的循环神经网络的模型,这个东西主要是用于语义分析的,可以分析文本的上下文什么的。
这两种神经网络就是二十一世纪的最初时间段里最热门的内容,王旭的实验室,现在正在慢慢地一点点出这方面的论文。
每年一两篇突破性论文,几篇扩展性论文的样子,已经算是回归到一个实验室正常的状态。现在在人工智能领域,算是一个比较有成果的实验室,在业界也有了些名气。
但说起来依旧都还是理论,由于华夏的硬件设备,软件设备,网络设备都还处于初始阶段,王旭有意识地压制了这方面的产出,真的没必要,做出来了,华夏也用不了。
倒是提供了一些给上面,让上面自己判断是否要用,毕竟神经网络学习也好,训练也罢,需要的数据资源都是海量的,需要的计算机计算资源更是几乎没有尽头。
本章未完,请点击下一页继续阅读! 第1页/共4页