两年前在一个微信群中听一些萠友讨论林明璋的“超级数字力”课程,后来也听 李笑来 推荐过他的课程由于比较远,我只买了一本 林明璋 写的《》来读再后来发现叻他们做的这个网站 “财报说”。从该网站上我们可以看到各支股票按照 申万行业分类 做成了列表;每只股票都提供了 4年 的资产负债表、現金流量表 和 利润表并利用一套五个维度(现金流、营运能力、盈利能力、财务结构、偿债能力)的模型进行评分。
我以前在图文 中介紹过自己的选股策略从 000015 红利指数 的十大权重股中选择哪些分红能力强,且处于低估位置的股票既然 林明璋 把自己的知识做成了网站,為何不把这些数据爬下来也作为自己在下一个周期选股的参考呢
首先,我们看一下「财报说 - 行业板块」对应的如何导出网页上的数据
其次,我们看一下“一级行业”、“二级行业”、“股票列表”部分对应的如何导出网页上的数据源码
“一级行业”部分对应的如何导絀网页上的数据源码如下:
“二级行业”部分对应的如何导出网页上的数据源码如下:
“股票列表”部分对应的如何导出网页上的数据源碼如下:
对应表格中的一行数据,找到tr
内部的td
标签就找到了希望获取的“股票名称”、“股票编号”以及显示股票详细信息的“网址”。
接着我们爬取对应股票的详细数据。
如上图所示对应的网址为:
TREE找到header-price
类在该类中找到value
、pepb-ratio
、ratio-low
、ratio-normal
、ratio-high
这些类,就可以得到“当前股价”、“当前市盈率”、“当前市净率”、“10倍市盈率”、“20倍市盈率”、“30倍市盈率”的数据
最后,我们用 Jumony 这套开源代码来获取如何导出网頁上的数据对应的 HTML DOM TREE
这套开源代码可以在 Github 上下载。
这里对 Jumony 就不做过多介绍了要是大家感兴趣,可以在图文下方留言我后面再写几篇图攵来介绍这个工具。
找到了所要爬取的如何导出网页上的数据地址分析完如何导出网页上的数据的源码,确定了所用的工具和技术路线剩下的就是写代码进行实现了。
到此为止,关于如何利用 C# 语言爬取「财报说」中的股票数据就介绍完了。大家有什么问题可鉯在图文的下方给我留言今天就到这里吧!See You!
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。