滚雪球 -- 收集沪深港通北上资金信息

自从沪深港通开通后,海外机构资金源源不断买入他们眼中最稀缺、最有价值的A股,并长期持有。

港交所从2017年3月17日起,每天公布沪深港通持股数量:

项目自动收集沪深港通持股数,聚合实时价格数据以获得持有市值排名。
可以买入排名靠前的几只股票,长期持有,近两年收益较高。

以docker方式进行部署,共三部分:

  1. collector 爬取沪深港通持股数并用雪球API获取对应价格,以linux crontab 为基础,用beautifulsoup4解析港交所web数据
  2. redis 作为数据存储载体
  3. web 使用tornado框架作为数据展示应用

WEB截图

Demo

安装

$:~/workdir# git clone https://github.com/uname-yang/collect-hkc-hold-position.git
$:~/workdir# cd collect-hkc-hold-position
$:~/workdir/collect-hkc-hold-position# docker-compose up -d
Creating collecthkcholdposition_redis_1 ...
Creating collecthkcholdposition_redis_1 ... done
Creating collecthkcholdposition_web_1 ...
Creating collecthkcholdposition_collect_1 ...
Creating collecthkcholdposition_web_1
Creating collecthkcholdposition_web_1 ... done
$:~/workdir/collect-hkc-hold-position# docker-compose ps
              Name                            Command               State            Ports
---------------------------------------------------------------------------------------------------
collecthkcholdposition_collect_1   /bin/sh -c cron && tail -f ...   Up
collecthkcholdposition_redis_1     docker-entrypoint.sh redis ...   Up      6379/tcp
collecthkcholdposition_web_1       /bin/sh -c python3 app.py        Up      0.0.0.0:20191->5000/tcp

结语

获取沪深港通持股数据的部分已单独发布成python包pyhkconnect,可返回pandas dataframe格式数据。

此项目代码已上传Github:https://github.com/uname-yang/collect-hkc-hold-position