本课程由数据预处理整个流程到综合实战。包括:Anaconda、Sublime、Pywin32、数据采集、数据集成、缺失值处理、正则、jieba分词、NLTK、词袋模型、数据抽样、特征词抽取、文本向量化、gensim、数据降维、numpy、sicpy、pandas、matplotlib、seabom、Xgboost等核心技术。
1、适用于数据科学从业人员、AI技术开发人员和科研工作者及学生群体。
2、学习者应具备python和数据科学的基础。
1、制定不同场景数据采集策略
2、文本数据抽取与集成、使用Python科学计算工具