蒹葭苍苍,白露为霜。
所谓伊人,在水一方。

苹果公司爬虫被“活捉”,疑为Siri创建自主搜索引擎

据一名开发者汇报,发现苹果在秘密使用网络爬虫抓取互联网上的HTML内容,不过他不能确定苹果这么做的目的。苹果的网络爬虫使用谷歌的Go语言编写,最早可以追溯到10月15日。其他开发者也纷纷报告,发现了苹果的网络爬虫踪迹,它只请求网站的HTML内容,不访问CSS, JavaScript或者图片文件。


苹果的网络爬虫使用Mozilla/5.0 (compatible; Fetcher/0.1)的身份。来自17.开头的IP地址,而这正是苹果的服务器所在。目前不能确定是苹果官方的行为,还是员工自己写的一个测试软件。如果是苹果官方的,也许暗示苹果正在秘密改善OS X 10.10和iOS8的Spotlight网络搜索功能,该功能让用户不需要打开谷歌或Bing搜索网站,虽然苹果不和谷歌、微软竞争,但是也在Siri里面提供了一定的信息,这样就不需要显示Bing的搜索结果了。

网络爬虫是一种“自动化浏览网络”的程序,或者说是一种网络机器人。它们被广泛用于互联网搜索引擎或其他类似网站,以获取或更新这些网站的内容和检索方式。它们可以自动采集所有其能够访问到的页面内容,以供搜索引擎做进一步处理(分检整理下载的页面),而使得用户能更快的检索到他们需要的信息。

赞(0) 打赏
未经允许不得转载:酷居科技 » 苹果公司爬虫被“活捉”,疑为Siri创建自主搜索引擎

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

锦瑟无端五十弦,一弦一柱思华年

酷居科技联系我们

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏