文| Freesia 编辑| Tong 来源| PANews

随着数字货币的日渐普及,越来越多的人将其视为一种投资手段。与其它投资手段相比,数字货币的巨大波动性兼具吸引力和破坏力。为了能够更加准确地预测其价格涨跌,人们分析了各种因素,采用了许多方法。

举例来讲,单是对比特币的价格预测,就有S.MaNally、 E.Sin等人发表的数篇论文。后者对于比特币价格拐点的预测,准确率达到了64%。也有人采用传统统计方法研究宏观经济以及公众观念对于币价的影响。近期,IEEE区块链大会收录的一篇新论文表示预测结果正确率显著高于S.MaNally、E.Sin两者所介绍的方法。

近日,由Chongyang Bai, Tommy White、Linda Xiao,、V.S. Subrahmanian与周子衡等共同完成的论文《数字货币价格涨跌引擎》,近期被IEEE区块链大会收录。其中,周子衡是唯链VeChain区块链的首席科学家。

该论文详细介绍了一种新型算法引擎——C2P2,用以预测次日数字货币的价格是上涨还是下跌。论文了21种最受欢迎的数字货币,在四个层面对价格涨跌进行比较(开盘价、收盘价、最高点、最低点)。因为考虑到外界因素(政策,法规,自然条件等)对币价的影响,C2P2采取了迭代优化算法,反复进行机器学习,缩小结果范围。

在分析了21种数字货币的特征因子后,论文团队抓取任意两种货币的相似之处,并将此相似因子纳入预测模型之中。丰富的变量是C2P2的一大特色。通过分类算法,C2P2成功纳入了包括公众观点、股票指数、债券利率、黄金和原油的价格等一系列会对币价产生影响的因子。

C2P2以协作分类模型为基础。其相关步骤主要分为三步:

1 以价格涨跌因素,宏观经济因素,和Reddit上公共观点因素为基础,建立以时间为变量,针对数字货币上涨或者下跌的特征向量。

2 采用步骤1中的特征向量,计算出任意两两货币间的相似因子。

3 使用迭代算法,代入相似因子和实际结果,反复进行机器学习。

图片.png

同时,C2P2算法还首创性地将社交媒体上人们的心理因素纳入了变量范围。团队抓取了Reddit上来自101,564个作者的1,624,674条评论。如何将这些公共观点转化成为数据化因子呢?团队采用了两个工具:Reddit统计和LIWC框架来进行统计。这两个工具可以统计评论数量和评分,还可以通过抓取关键字,来分析评论的情绪状态。另外,团队还使用了谷歌云语言(Google Cloud Natural Language API)对每天所有Reddit评论进行分析,建立图表。最终,每天针对每种数字货币,团队可以得出66个观点因子。

相应地,团队在抓取宏观经济因素时,广泛纳入了大量数据,包括世界十大股票指数,债券利率,原油价格等变化。每天针对每种数字货币,得到88个经济因子。团队再将每种数字货币的历史价格与上述因子结合,得到以时间为变量的相关特征向量。

通过分析每种数字货币的特征向量,可以计算两两货币间的相似因子。文章中设计了实验,来验证面对同样的数字货币,C2P2和另外两种方式孰优孰劣。实验结果显示,C2P2明显胜出。然而如果不考虑相似因子,C2P2的相对优势会被削弱。可见在C2P2算法中,相似因子是非常重要的一环。

综合上述因素,团队得出对数字货币上涨概率的预估值。将预估值与相似因子结合,生成机器学习的特征向量。接下来通过不断更新每日的特征向量,反复进行机器学习,最终得到对于价格上涨的预测。