WebCrawlerPractice

功能：

Program，Course两个储存类
- 两项储存类均有一个visible标签方便用于文本存储以及分辨是否有效
- 数据结构为字典
Finder作为基础的爬虫模版
- 包含一个待访问的域名domain，一个访问domain返回其html文本的method
- 子类均使用字典保存信息
- 两个子类需要实现的方法：
  - data_extraction：提取网页中的次级连接并获取html，存储于字典中
  - data_construction：对字典中的所有html进行分析，提取信息
ProgramFinder为Finder子类
- 从Program Info Page提取所有Program名称及链接，建立Program类存储于字典中
- 对于非标准链接，设置visible为false
CourseFinder为Finder子类
- 从指定Program Page中提取所有course code，建立Course类，生成对应的Course Finder链接，保存html
- 对字典中所有已有课程，分析html文件，分辨链接是否有效，对有效链接保存信息
FileSystem负责保存爬下来的字典，字典均为key：object的格式，并且要求object有一个visible的标签及getter
Main实现了一个简单的命令行交互：提供Program列表，用户需选取Program及学期

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.idea		.idea
.vscode		.vscode
Abandon		Abandon
Course.py		Course.py
CourseFinder.py		CourseFinder.py
FileSystem.py		FileSystem.py
Finder.py		Finder.py
Main.py		Main.py
Program.py		Program.py
ProgramFinder.py		ProgramFinder.py
README.md		README.md
Struct.graffle		Struct.graffle
UTAnalysis.py		UTAnalysis.py
course.txt		course.txt
programs.txt		programs.txt