技术解析

轻松合理的获取数据 | 基于标记语言的开源爬虫框架(Trico cloud 云原生)
0
2021-06-01 12:25:03
idczone

写在前面

名词解释

  • Trico 框架名。
  • Trico script 官方脚本代码。
  • Salyut 脚本虚拟机 负责语法解析,表达式解析。
  • Trico clo抗投诉服务器ud Trico 生态,将脚本调度和虚拟机在云端部署。

Trico 的诞生

Trico起初是为了满足公司大量的数据提取需求(当然是公开可获取的:)),最早我们是使用 Java+Jsoup+selenium 来完成的。但是随着维护的网站数量越来越多,网站的改版等等异常将会产生大量的工作量,于是我们就想能不能有个轻量级的脚本,既可以热更新(快速的解决 Bug )又可以提供一些带有复合功能的元语 来提高开发效率。于是 Trico 就诞生了。

如何使用 Trico

Trico 是一个基于标记语言的脚本语言,词法相对都比较简单,学习曲线相对降低,一般的程序员 1 ~ 2 天即可以完全上手。当然我们也希望对于不是程序员背景也能使用 Trico,把他当作一个数据的提供者或者了解编程概念的语言。

  • Salyut 语法
  • 快速开始

看到这里想必你对 Trico 或多或少有一些兴趣,我们也开源了 Salyut 引擎,方便的话请给我们个 Star,给我们个鼓励。

数据地带为您的网站提供全球顶级IDC资源
在线咨询
专属客服