基于word2vec文本聚类绘制图表

  • 中级Tableau指南 - 适用于数据科学和商业智能专业人员

现在让我们看看这个集成的步骤:

作为一名数据探索者保持创意并保持最佳状态!

李清扬,清华大学工商管理研究生在读主修管理学。对大数据、人工智能在经济金融领域的应用感兴趣希望能在数据派平台获得大数据前沿知识,找到志同道合的朋友一起研究和应用数据分析工具于企业管理实践当中。

工作内容:需要一颗细致的心将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组

你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带來好的发展机遇

其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴

}
基于改进CFSFDP算法的文本聚类方法及其应用*
杭州电子科技大学计算机学院 杭州 310018

通过粒子群算法寻找CFSFDP算法中的最佳局部密度和距离阈值, 得到相对较高的局部密度和距离的聚类中惢, 减少离散点对数据中心选取的影响, 并在某高考咨询平台提供的考生问题库中随机选取数据集进行试验【结果】实验结果表明, 在不同的數据集中, 本文算法相对于基本的CFSFDP算法在准确率、召回率、F值上均有明显提高。【局限】文本处理时没有考虑语义关系【结论】本文方法囿很好的聚类效果, 应用在高考咨询库中能够有效地减轻被咨询方的工作量并且帮助快速回答考生的问题。

基金资助:*本文系国家自然科学基金青年基金项目“引入涉身认知机制的汉语隐喻计算模型及其实现”(项目编号:)、国家自然科学基金青年基金项目“基于马尔科夫树与DRT的汉語句群自动划分算法研究”(项目编号: )和教育部人文社会科学研究青年基金项目“面向信息处理的汉语隐喻计算研究”(项目编号:
张文开. 基于密度的层次聚类算法研究[D]. 合肥: 中国科学技术大学, 2015.
马春来, 单洪, 马涛. 一种基于簇中心点自动选择策略的密度峰值聚类算法[J]. 计算机科学, ): 255-258.
刘建华. 粒孓群算法的基本理论及其改进研究[D]. 长沙: 中南大学, 2009.
黄承慧, 印鉴, 侯昉. 一种结合词项语义信息和TF-IDF方法的文本相似度量方法[J]. 计算机学报, ): 856-864.
谭静. 基于向量空间模型的文本相似度算法研究[D]. 成都: 西南石油大学, 2015.
赵俊杰, 胡学钢. 基于文本分类的文档相似度计算[J].微型电脑应用, ): 46-47.
张鸣. 符号数据聚类评价指標研究[D]. 太原: 山西大学, 2013.
段明秀. 层次聚类算法的研究及应用[D]. 长沙:中南大学, 2009.


}

我要回帖

更多关于 基于word2vec文本聚类 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信