威廉希尔

新工科中心

2018级卓中卓选拔挑战第三站

发布时间:2019-07-07 18:28:41 发布者:新工科中心 作者: 查看:3198

2018级同学:

    恭喜仍有同学坚持到第3站,老师们为你们的热情和坚持感到骄傲!

挑战内容:

【题目一】

robots是网站跟爬虫间的协议,用简单直接的txt格式文本方式告诉对应的爬虫被允许的权限。过去20多年间,各互联网公司依据该协议在内容爬取和保护方面达成了默契与共识。该协议的核心是robots.txt 解析器,它是一个 C++ 库,用于解析和匹配 robots.txt 文件中的规则,已经有约 20 年历史。请根据谷歌开源的工程代码(https://github.com/google/robotstxt),对工程结构、关键代码、实现算法等进行分析,形成研究报告。并在此基础上提出可以改进的内容。尝试利用Github的协作机制向该工程贡献代码。


【题目二】

自主选题,体现在假期状态的2周中,关于底层系统组件或关键系统(操作系统、网络协议、图像引擎、数据库、人工智能平台相关)的重构。


所有题目交回的内容有:

1、对问题的解决思路分析和算法设计文档、分析报告等

2、可编译的代码和可执行的文件(若可以必须)

本次挑战,根据提交的资料质量,可计1~5分。



提交方式:发至403297364【AT】qq.com,且须抄送地址48727155【AT】@qq.com

本站挑战截止时间:7月21日

Baidu