2-3 HanLP分词精讲
使用慕课网App
可
免费学习
本课全部内容
使用App学习
介绍
章节
问答
笔记
第1章 清洗文本信息
1-1 30万条数据准备情况
1-2 yield生成器实现斐波那契数列
1-3 递归遍历读取30万新闻数据
1-4 高效读取30万新闻数据
1-5 正则表达式介绍与常见使用场景(1)
1-6 正则表达式清洗文本数据(2)
1-7 清洗HTML网页数据
1-8 简繁字体转换
1-9 批量清洗30万新闻文本数据
第2章 文本特征提取
2-1 jieba分词精讲(1)
2-2 jieba分词精讲(2)
2-3 HanLP分词精讲
2-4 自定义去停用词
2-5 NLTK词频统计(1)
2-6 NLTK词频统计(2)
2-7 自定义选择高低词频
2-8 命名实体的提取
2-9 slearn计算多分类下的TFIDF
2-10 实战案例:30万新闻文本特征提取
下载APP使用
问答
功能