当前位置:首页 » 股票入门 » 大数据与股票交易
扩展阅读
设计总院股票历史股价 2023-08-31 22:08:17
股票开通otc有风险吗 2023-08-31 22:03:12
短线买股票一天最好时间 2023-08-31 22:02:59

大数据与股票交易

发布时间: 2023-05-30 10:49:49

❶ 用大数据炒股,靠谱吗

利用大数据炒股是现在的量化交易趋势,可以快速整合海量数据进行分析,但目前的大数据可能还不够成熟,不能仅此作为依据,要谨慎使用,避免判断失误。

如需了解股票,您也可以登录平安口袋银行APP-金融-股票进行查询。

温馨提示:本信息不构成任何投资建议,投资者不应以该等信息取代其独立判断或仅根据该等信息做出决策,不构成任何买卖操作。
投资者应该充分认识投资风险,谨慎投资,充分了解并清楚知晓产品蕴含风险的基础上,通过自身判断自主参与交易,并自愿承担相关风险。
应答时间:2022-01-27,最新业务变化请以平安银行官网公布为准。

❷ 大数据的应用领域有哪些

1.了解和定位客户

这是大数据目前最广为人知的应用领域。很多企业热衷于社交媒体数据、浏览器日志、文本挖掘等各类数据集,通过大数据技术创建预测模型,从而更全面地了解客户以及他们的行为、喜好。

利用大数据,美国零售商Target公司甚至能推测出客户何时会有Baby;电信公司可以更好地预测客户流失;沃尔玛可以更准确的预测产品销售情况;汽车保险公司能更真实的了解客户实际驾驶情况。

滑雪场利用大数据来追踪和锁定客户。如果你是一名狂热的滑雪者,想象一下,你会收到最喜欢的度假胜地的邀请;或者收到定制化服务的短信提醒;或者告知你最合适的滑行线路。。。。。。同时提供互动平台(网站、手机APP)记录每天的数据——多少次滑坡,多少次翻越等等,在社交媒体上分享这些信息,与家人和朋友相互评比和竞争。

除此之外,政府竞选活动也引入了大数据分析技术。一些人认为,奥巴马在2012年总统大选中获胜,归功于他们团队的大数据分析能力更加出众。

2.

改善医疗保健和公共卫生

大数据分析的能力可以在几分钟内解码整个DNA序列,有助于我们找到新的治疗方法,更好地理解和预测疾病模式。试想一下,当来自所有智能手表等可穿戴设备的数据,都可以应用于数百万人及其各种疾病时,未来的临床试验将不再局限于小样本,而是包括所有人!

苹果公司的一款健康APPResearchKit有效将手机变成医学研究设备。通过收集用户的相关数据,可以追踪你一天走了多少步,或者提示你化疗后感觉如何,帕金森病进展如何等问题。研究人员希望这一过程变得更容易、更自动化,吸引更多的参与者,并提高数据的准确度。

大数据技术也开始用于监测早产儿和患病婴儿的身体状况。通过记录和分析每个婴儿的每一次心跳和呼吸模式,提前24小时预测出身体感染的症状,从而及早干预,拯救那些脆弱的随时可能生命危险的婴儿。

更重要的是,大数据分析有助于我们监测和预测流行性或传染性疾病的暴发时期,可以将医疗记录的数据与有些社交媒体的数据结合起来分析。比如,谷歌基于搜索流量预测流感爆发,尽管该预测模型在2014年并未奏效——因为你搜索“流感症状”并不意味着真正生病了,但是这种大数据分析的影响力越来越为人所知。

3.提供个性化服务

大数据不仅适用于公司和政府,也适用于我搏衫们每个人,比如从智能手表或智能手环等可穿戴设备采集的数据中获益。Jawbone的智能手环可以分析人们的卡路里消耗、活动量和睡眠质量等。Jawbone公司已经能够收集长达60年的睡眠数据,从中分析出一些独到的见解反馈给每个用户。从中受益的还有网络平台“寻找真爱”,大多数婚恋网站都使用大数据分析工具和算法为用户匹配最合适的对象。

4.

了解和优化业务流程

大数据也困毕越来越多地应用于优化业务流程,比如供应链或配送路径优化。通过定位和识别系统来跟踪货物或运输车辆,并根据实时交通路况数据优化运输路线。

人力资源业务流程也在使用大数据进行优化。SociometricSolutions公司通过在员工工牌里植入传感器,检测其工作场所及社交活动——员工在哪些工作场所走动,与谁交谈,甚至交流时的语气如何。美国银行在使用中发现呼叫中心表现最好的员工——他们制定了小组轮流休息制度,平均业绩提高了23%。

如果在手机、钥匙、眼镜等随身物品上粘贴RFID标签,万一不小心丢失就能迅速定位它们。假想一下未来可能创造出贴在任何东西上的智能标签。它们能告诉你的不仅是物体在哪里,还可以反馈温度,湿度,运动状态等等。这将打开一个全新的大数据时代,“大数据”领域寻求共性的信息和模式,那么孕育其中的“小数据”着重关注单个产品。

5.

改善城市和国家建设

大数据被用于改善我们城市和国家的方方面面。目前很多大城市致力于构建智慧交通。车辆、行人、道路基础设施、公共服务场所都被整合在智慧交通网络中,以提升资源运用的效率,优化城市管理和服务。

加州长滩市正在使用智能水表实时检测非法用水,帮助一些房主减少80%的用水量。洛杉矶利用磁性道路传感器和交通摄像头的数据来控制交通灯信号,从而优化城市的交通流量。据统计目前已经控制了全市4500个交通灯,将交通拥堵状况减少了约16%。

6.提升科学研究

大数据带来的无限可能性正在改变科学研究。欧洲核子研究中心(CERN)在全球遍布了150个数据中心,有65,000个处理器,能同时分析30pb的数据量,这样的计算能力影响着很多领域的科学研究。比如政汪银芹府需要的人口普查数据、自然灾害数据等,变的更容易获取和分析,从而为我们的健康和社会发展创造更多的价值。

7.提升机械设备性能

大数据使机械设备更加智能化、自动化。例如,丰田普锐斯配备了摄像头、全球定位系统以及强大的计算机和传感器,在无人干预的条件下实现自动驾驶。XcelEnergy在科罗拉多州启动了“智能电网”的首批测试,在用户家中安装智能电表,然后登录网站就可实时查看用电情况。“智能电网”还能够预测使用情况,以便电力公司为未来的基础设施需求进行规划,并防止出现电力耗尽的情况。在爱尔兰,杂货连锁店Tescos的仓库员工佩戴专用臂带,追踪货架上的商品分配,甚至预测一项任务的完成时间。

8.强化安全和执法能力

大数据在改善安全和执法方面得到了广泛应用。美国国家安全局(NSA)利用大数据技术,检测和防止网络攻击(挫败恐怖分子的阴谋)。警察运用大数据来抓捕罪犯,预测犯罪活动。信用卡公司使用大数据来检测欺诈交易等等。

2014年2月,芝加哥警察局对大数据生成的“名单”——有可能犯罪的人员,进行通告和探访,目的是提前预防犯罪。

9.

提高体育运动技能

如今大多数顶尖的体育赛事都采用了大数据分析技术。用于网球比赛的IBMSlamTracker工具,通过视频分析跟踪足球落点或者棒球比赛中每个球员的表现。许多优秀的运动队也在训练之外跟踪运动员的营养和睡眠情况。NFL开发了专门的应用平台,帮助所有球队根据球场上的草地状况、天气状况、以及学习期间球员的个人表现做出最佳决策,以减少球员不必要的受伤。

还有一件非常酷的事情是智能瑜伽垫:嵌入在瑜伽垫中的传感器能对你的姿势进行反馈,为你的练习打分,甚至指导你在家如何练习。

10.金融交易

大数据在金融交易领域应用也比较广泛。大多数股票交易都是通过一定的算法模型进行决策的,如今这些算法的输入会考虑来自社交媒体、新闻网络的数据,以便更全面的做出买卖决策。同时根据客户的需求和愿望,这些算法模型也会随着市场的变化而变化。

❸ 同盾大数据能查到股票交易吗

不能。同盾大数据不能查到股票交易,同盾大数据基本包含了网贷一信吵岩半以上的平台和公司。可以提供信贷审查和反欺诈服务,因为滑御碰尘中国央行征信只覆盖了银行还有传统的金融机构。

❹ 哪有大数据的股市分析

大智慧(7.23.4)、同花顺(.76.9)、通达信(4.32.1),东方财付通(6.32.4)都有大数据分析系统,
1、大智慧
大智慧简单易懂,数据分析系统也很完善、指标系统专业,画面也简洁。 同花顺 界面有点复杂,数据分析系统,指标系统,都很好,就是编程有点复杂,需要有一定的编程知识。特别是大数据分析选股方面学起来有点吃力。适合专业选手。
2、通樱皮达信
通达信是国内用得比较多的软件,画面简洁,每次更新,版面变化不大,不仔细看,看不出来。不过 大数据分析系统功有点少,老年用户、新股民用得比较多。
3、东方财富通
更新较快,每次跟他们提的意见,都能及时的回复,还不错。他的大数据分析系统,再加上网站的数据,很及时,准确。
拓展资缺谈料
一、股票交易手续费是进行股票交易时所支付的手续费。委托买卖的手续费分“阶段式”和“跟价式”。
(1)阶段式。根据股票价格和交易股数收取手续费。
(2)跟价式。根据股票的交易金额收取手续费,目前世界上多采用跟价式。
第二次世界大战以后,许多国家为避免证券公司间的过度竞争,稳定证券业的经营,采取委托交易手续费最低限额制度。70年代中期以来,在证券市场自由化潮流的冲击下、美国、英国等一些国家先后放弃这一制度,实现委托交易手续费的自由化,但日本等国至今仍实行这一制度。
股票交易是指股票投资者之间按照市场价格对已发行上市的股票所进行的买卖,包括场内交易和场外交易。股票公开转让的场所首先是证券交易所。中国大陆仅有两家交易所,即上海证券交易所和深圳证券交易所。
二、费用内容
1.印花税:成脊扮差交金额的1‰。2008年9月19日至今由向双边征收改为向出让方单边征收。受让者不再缴纳印花税。投资者在买卖成交后支付给财税部门的税收。上海股票及深圳股票均按实际成交金额的千分之一支付,此税收由券商代扣后由交易所统一代缴。债券与基金交易均免交此项税收。
2.证管费:成交金额的0.002%双向收取
3.证券交易经手费:A股,按成交金额的0.00487%双向收取;B股,按成交额0.00487%双向收取;基金,上海证券交易所按成交额双边收取0.0045%,深圳证券交易所按成交额0.00487%双向收取;权证,按成交额0.0045%双向收取。 A股2、3项收费合计称为交易规费,合计收取成交金额的0.00687%,包含在券商交易佣金中。
4.过户费(从2015年8月1日起已经更改为上海和深圳都进行收取):这是指股票成交后,更换户名所需支付的费用。根据中国登记结算公司的发文《关于调整A股交易过户费收费标准有关事项的通知》,从2015年8月1日起已经更改为上海和深圳都进行收取,此费用按成交金额的0.02‰收取。

❺ 利用大数据炒股会赚吗

随着科学技术的发展,现在很多炒股软件都可以方便快捷地找到上市公司的关键数据。用大数据分析找出大股东的持仓成本,就等于看到了经销商的底牌。购买价格接近或低于市场平均持仓成本。利润机会越大,安全系数越高。

因为大数据分析人们的常识性需求或一些习惯性行为,只能通过多次或多次发生的常见行为事件找出一些规律。上述行为事件是相对固定时间或基本需求或习惯的单一行为的结果。作为股东,没有人能够预测未来。我们不否认这一点。然而,很少有人会否册巧森认每个人都可以回顾历史。我们不知道未来会上升还是下降。我们不知道如何波动。然而,如果一个好故事讲得很辛苦,说书人肯定会得到好处。粉丝越多,他得到的好处就越多。

❻ 可以利用大数据炒股吗

大数据可以用于股票交易,所谓大数据,就是一个新的分析概念,利用新的系统、新的工具、新的模型来挖掘大量动态的、可持续的数据,从而获得具有洞察力和新价值的东西。大数据已经在一些金融工具中有所体现,大数据会将股票之前的数据全都发布出来,股民可以根据这只股票之前的数据来进行对比。

其实大数据只能说是个趋势,我们可以通过打数据让投资者能够有一个参考性,但不能够过度依赖大数据,毕竟着只是数据,这些数据是死的,而股市却是千变万化的,我们不能过度的依赖大数据得出的分析与结论,大数据也只是作为一个参考数据。世事无绝对,更何况是股票,可能上一秒还是盈利的状态,但是下一秒就已经处于亏损了,不少人也因为炒股倾家荡产,所以这边还是要提醒大家一下,谨慎行事,不要盲目跟风。

❼ 大数据是哪类股票属什么板块成长性如何

现在还去投资股票的人都是傻子,我在国泰君安里面就做过股票讲师,没有人比我有权利解答这个问题:
股票的涨跌就是多空拼杀,买入的资金多仔郑,股票就涨,卖出的人多,股票就跌。很显然拥有大资金的人就可以轻松操控股价。国外显然不同,当用户大资金买入股票时,证监会立马就有电话询问:“你持重仓的原因是什么,而念链颂且需要自己举证,否则就按非法操控股价为由冻结资金,甚至是多倍盈利的罚单,最高以诈骗罪判刑。中国股票交易市场的制度目前还不健全,不适合散户投资,也这是为什么国外大盘涨的的时候中国大盘跌的病根所在,
大家会问,中国的股票在刚刚兴起时,很多人都大赚,为什么近几年来就没有听到谁买股票发财了呢?笔者经过多年实战和同行交流,总结出以下三条原因:
第一、机构优势
公司为了成功上市,通常需要大资金来拉动股价,按每股发行价一元计算,对做一级市商的机构来唤信讲,他们因为量大的关系,往往每股只需0.8元~0.9元的成本。对于我们散户的股民来讲,就算第一时间入场,其实已经买了高价股,风险可想而知。
第二、内幕交易
股价的涨跌除了国家政策调控,还因公司因发展战略事项有着密切的关系,公司有重大决策之前,散户股民是不可能知道,软件公布数据的时候,已是事后。
第三、庄家操控
按一家上市公司发行一亿股,每股十元的发行价,即总市值十亿元,拥有五六亿元的个体和庄家就可以操控股价,散户就是任人宰割的羊。
如果要做投资方面的,欢迎(扣我)网络号。

❽ 炒股App 大数据丢在风口上的蛋

炒股App:大数据丢在风口上的蛋

尽管炒股App处于刚刚勃兴阶段,但业内几乎在短时间内迅速就其产品模式达成了共识——将交易与交流相结合,组建日常化的投资社区。在此之下,不同背景与定位的炒股App开始探索各自的商业模式,谋求符合自己的生存之道 ...

据媒体报道,与2007年“大牛市”不同,2014年以来的大牛市伴随移动互联网的蓬勃发展,特别是微信、移动新闻客户端等加快了信息传播速度。2007年时,股票投资者还需要在同花顺、大智慧等PC客户端浏览行情;而今,几十个乃至近百个新式炒股App蓬勃而生,为无数赶赴牛市的“85后”新生代投资者提供参考。

一场以炒股App寻找全新App增长点的创投热情,更在四五月间股市的“牛气冲天”中,被极度释放,进而又在6月末的一连串股市大跌之中,被非议无数。作为已经不再热门的App创业中的一支奇葩,在股市的风口上,炒股App到底能够走多远?

社交应用的股票定制版?

在有关提到此次炒股App热的媒体报道中,常有一段话,专门用来解析过去主要应用于PC的炒股软件和当下应用于手机的炒股App的区别:“尽管炒股App处于刚刚勃兴阶段,但业内几乎在短时间内迅速就其产品模式达成了共识——将交易与交流相结合,组建日常化的投资社区。在此之下,不同背景与定位的炒股App开始探索各自的商业模式,谋求符合自己的生存之道。”

如果翻译成更为浅显的话语,可以理解为这些炒股App的基础架构颇类似微信、微博之类的社喊培交应用,一些炒股达人则成为这一社交应用之中的微信公众号或者微博大V。当然,草根股民也可以用朋友圈,发表一下自己对股市的看法。

这样的平台架构,其实在技术上已经没有多少难度可言,因此,其快速爆发的效率可以用“扎堆”来形容。据6月22日中国之声《新闻晚高峰》报道:“任意一个App Store,与‘炒股’相关的新式App有几十至近百个之多,包括公牛炒股、优顾炒股、短线放大器、投资堂等。”而火爆程度呢?“网络指数也显示,近一个月内关键词‘炒股软件’的搜索指数整体同比上升了834%,移动端同比上升超1000%。”

如此红火的炒股App势头,它真正和过去大智慧、同花顺这样的PC客户端相比,当然并不仅仅是炒股社交化如此简单。以2011年就上线的炒股App股票雷达为例,其创始人冯月就坦言:在做法上,股票雷达要求投资者都必须公布自己的投资记录,形成交易数据公开;通过一定时间内的收益排名数据比较自动推出“股票高手”,允许用户跟着高手投资。一旦关注某个高手后,平台会自动向投资者发送该高手仓位实时变化消息。凭借“有迹可循”和“跟单交易”的新颖模式,股票雷达很快就吸引了首批用户,截至目前,股票雷达实盘日交易额已经有几亿元,股票雷达团队也已突破100人。

这被冯月称之为是一种大数据的呈现,而真正对于股民来说,这其实就是一个实时的操作指南。这是以往大智慧、同花顺等老牌股票应用,主要提供一些股票推荐和相关资讯所不能及的。

据《深市新开户个人投资者学历分析报告》显示,在2014年初到2015年3月31日之间的新开户投资者中,30岁以下人群占比达到37.7%。这一批在互联网土壤上生长起来的“85后”股市小白用户,跟着带头大哥混的思维逻辑就是他们炒股的刚性需求。

一个前度玩家的新游戏

对于炒股App和过去的炒股软件的区别,笔者有一个更为形象的比方,后者其实就是一款单机游戏,而大智慧们提供的各种资讯,则是股票这款游戏的玩家们,在一个封闭的小房子里,独自专研着属于自己的游戏攻略。你其实是一个人在战斗。个人在股市里摸爬滚打的长期经验和对信息的分析研判能力,将为一次又一次通关,增加一些成功的砝码。

而前者,则是一款网络游戏,面对全新的关卡,一个新手往往顿时迷失了方向,如果沿用过去的方法,去研究游戏攻略,学费高、课程长、见效慢。但在社交平台上,郑迟唯可以有另一个选择,跟着有经验的老前辈、股票高手们一起,去开荒捞点战利品。当然,这依然不能保证通关,但至少这是摆在还不太懂股市的“票友”们最简单粗暴的炒股赚钱方式。

其实,这两种旦渗模式之间,是有过渡阶段的,即在2007年上一轮牛市期间,在博客平台上一度跃红的那些荐股牛人,包括曾被誉为中国第一博后又因为诈骗罪而入狱的“带头大哥777”。所不同的是,这个中间阶段的过渡平台,依然延续着那些专家荐股、炒股达人的神话,加上信息的不透明性和仅仅为推荐而非真正实时操盘,而备受诟病。

这就涉及一个所谓盈利模式的话题。即前代产品如大智慧、同花顺的盈利模式,其实最主要的还是作为一个平台,协助股民浏览行情、获取资讯、完成交易,并收取金融信息服务费用和少量的广告费用。这种其实还停留在过去“卖产品”的服务模式和股票门户平台的定位,在越来越海量的信息数据爆炸下,也越来越不合时宜,也更加地向摸爬滚打股海多年的重度股民方向发展,也使得其业绩一直表现乏力。5月的媒体报道中,一位分析师则对腾讯财经表示,大智慧一向擅长给资本市场讲故事,但其主业一直陷于巨额亏损,商业模式不可持续。

反之走“跟高手炒股”概念的股票雷达、雪球等炒股App,则以反专业化的面目出现,即用“高手”这一概念,以及自己平台对大量碎片化信息数据的分析并简化成买进卖出的量化结果,让小白用户可以快速赚钱,并迅速地为自己的平台聚集起人气。“人气就是入口”,对于移动互联网的App们来说,有了人气,并用真正能赚到钱来黏住用户,盈利模式总会有的。到6月,据称股票雷达和雪球上的日均活跃用户数接近100万,对于一款“网络游戏”来说,社区的内容贡献问题、高手数量、跟随的小弟资源,均已盘活了。

只是,在大牛市下,怎么炒都容易赚钱,矛盾不易爆发。但万一熊了呢?

大数据!一个有关预测的局

万一熊了,能不能真正让小白用户“跟高手炒股”赚到钱,就成为决定App黏合度的最终关键,为此,有志于炒股App的各路英雄,包括BAT们,都祭出了同一张牌——大数据。

腾讯早在2012年就推出了“自选股”App,在其社交领域基础上打造“股票圈”;网络今年2月上线了选股App网络股市通,主推智能选股。阿里则在5月牵手第一财经,将第一财经专业的财经资讯、投研报告内容,通过支付宝“股市行情”端口直接抵达3亿支付宝用户。

在某种意义上,腾讯的“自选股”颇为类似上述草根创业的炒股App,阿里则以更为专业和标准化生产采集的第一手资讯和服务压过传统炒股软件大智慧们一头。两大巨头的切入角度,均是以自己最优势而竞争对手难以山寨的平台力量,可谓刁钻,但尚不具备颠覆力量;而最具典范意义的则是网络的股市通,其号称基于网络每天数亿量级的政经类搜索数据和数百万新闻资讯信息,通过专业的数据挖掘和分析技术,将新闻信息、搜索数据与股票建立起相应的关系,以信息的热度变化来实时分析股票市场的变动。

简言之,就是通过信息流的快速变化得出一个涨跌的大数据结论,这个大数据优势,只有网络具备,其原理颇为类似早前网络推出依托区域面积内使用网络地图的人数而形成的景区热力图,来帮助出行人士选择到底是看人海还是看风景。这一基于大数据和人工智能技术的“智能选股”服务,据其统计数据显示,上线3个月以来,网络股市通应用大数据推出的热点有685个。如果以每个热点的关联股票作为一个组合,平均仓位以当日开盘价买入,第二天开盘价卖出计算,有78%的热点题材股票是上涨的,且日均涨幅达到1.7%。如果按照A股1年240个交易日计算,年复利收益在理论上达到56倍。

但这依然只是一个理论化的模型,其特点也仅仅是用数据的力量来分析海量信息流,跳过股民不关心的分析过程而直接导出一个预测结果,与“跟高手炒股”的区别,也主要在于一个是以算法来预测,一个则更多依靠经验来预测。

且“跟高手炒股”目前也在探索一种经验型大数据的解决方案,如股票雷达等,也在考虑除了供应大量信息和订阅高手动态的方式之外,对信息数据以及高手们的实时动态,而形成一系列预测结果,甚至介入中信证券、广发证券、国金证券、方正证券、国联证券等老牌券商,以形成更具指导力的结果,供小白用户直接选择。

怎么样的大数据分析方案,其实都只是各个入局炒股App根据自身优势与特点,对“真正能为小白客户实现简化投资”这一结果而找寻的出路,但真正能否预测到结果呢?正如抽样调查只能为选举结果提供参考系一样,仅仅来自于某些领域的大数据,其实也只是一个较大的参考系,而非全量的数据分析,其参考价值更大,但也仅仅只是参考,是更无限接近真相的一个预测。

股市有风险,投资需谨慎。这句话同样适用于炒股App们,能否在牛市和熊市的不同阶段保持对用户的黏合性,能否总是保持正确,很重要。而这其中,除了科学的大数据参考外,还有那么一丝赌博的味道。

以上是小编为大家分享的关于炒股App 大数据丢在风口上的蛋的相关内容,更多信息可以关注环球青藤分享更多干货

❾ 如何用大数据炒股

我们如今生活在一个数据爆炸的世界里。网络每天响应超过60亿次的搜索请求,日处理数据超过100PB,相当于6000多座中国国家图书馆的书籍信息量总和。新浪微博每天都会发布上亿条微博。在荒无人烟的郊外,暗藏着无数大公司的信息存储中心,24小时夜以继日地运转着。
克托·迈尔-舍恩伯格在《大数据时代》一书中认为,大数据的核心就是预测,即只要数据丰富到一定程度,就可预测事情发生的可能性。例如,“从一个人乱穿马路时行进的轨迹和速度来看他能及时穿过马路的可能性”,或者通过一个人穿过马路的速度,预测车子何时应该减速从而让他及时穿过马路。

那么,如果把这种预测能力应用在股票投资上,又会如何?

目前,美国已经有许多对冲基金采用大数据技术进行投资,并且收获甚丰。中国的中证广发网络百发100指数基金(下称百发100),上线四个多月以来已上涨68%。

和传统量化投资类似,大数据投资也是依靠模型,但模型里的数据变量几何倍地增加了,在原有的金融结构化数据基础上,增加了社交言论、地理信息、卫星监测等非结构化数据,并且将这些非结构化数据进行量化,从而让模型可以吸收。

由于大数据模型对成本要求极高,业内人士认为,大数据将成为共享平台化的服务,数据和技术相当于食材和锅,基金经理和分析师可以通过平台制作自己的策略。

量化非结构数据

不要小看大数据的本领,正是这项刚刚兴起的技术已经创造了无数“未卜先知”的奇迹。

2014年,网络用大数据技术预测命中了全国18卷中12卷高考作文题目,被网友称为“神预测”。网络公司人士表示,在这个大数据池中,包含互联网积累的用户数据、历年的命题数据以及教育机构对出题方向作出的判断。

在2014年巴西世界杯比赛中,Google亦通过大数据技术成功预测了16强和8强名单。

从当年英格兰报社的信鸽、费城股票交易所的信号灯到报纸电话,再到如今的互联网、云计算、大数据,前沿技术迅速在投资领域落地。在股票策略中,大数据日益崭露头角。

做股票投资策略,需要的大数据可以分为结构化数据和非结构化数据。结构化数据,简单说就是“一堆数字”,通常包括传统量化分析中常用的CPI、PMI、市值、交易量等专业信息;非结构化数据就是社交文字、地理位置、用户行为等“还没有进行量化的信息”。

量化非结构化就是用深度模型替代简单线性模型的过程,其中所涉及的技术包括自然语言处理、语音识别、图像识别等。

金融大数据平台-通联数据CEO王政表示,通联数据采用的非结构化数据可以分为三类:第一类和人相关,包括社交言论、消费、去过的地点等;第二类与物相关,如通过正在行驶的船只和货车判断物联网情况;第三类则是卫星监测的环境信息,包括汽车流、港口装载量、新的建筑开工等情况。

卫星监测信息在美国已被投入使用,2014年Google斥资5亿美元收购了卫星公司Skybox,从而可以获得实施卫星监测信息。

结构化和非结构化数据也常常相互转化。“结构化和非结构化数据可以形象理解成把所有数据装在一个篮子里,根据应用策略不同相互转化。例如,在搜索频率调查中,用户搜索就是结构化数据;在金融策略分析中,用户搜索就是非结构化数据。”网络公司人士表示。

华尔街拿着丰厚薪水的分析师们还不知道,自己的雇主已经将大量资本投向了取代自己的机器。
2014年11月23日,高盛向Kensho公司投资1500万美元,以支持该公司的大数据平台建设。该平台很像iPhone里的Siri,可以快速整合海量数据进行分析,并且回答投资者提出的各种金融问题,例如“下月有飓风,将对美国建材板块造成什么影响?”

在Kensho处理的信息中,有80%是“非结构化”数据,例如政策文件、自然事件、地理环境、科技创新等。这类信息通常是电脑和模型难以消化的。因此,Kensho的CEO Daniel Nadler认为,华尔街过去是基于20%的信息做出100%的决策。

既然说到高盛,顺便提一下,这家华尔街老牌投行如今对大数据可谓青睐有加。除了Kensho,高盛还和Fortress信贷集团在两年前投资了8000万美元给小额融资平台On Deck Capital。这家公司的核心竞争力也是大数据,它利用大数据对中小企业进行分析,从而选出值得投资的企业并以很快的速度为之提供短期贷款。

捕捉市场情绪

上述诸多非结构化数据,归根结底是为了获得一个信息:市场情绪。

在采访中,2013年诺贝尔经济学奖得主罗伯特•席勒的观点被无数采访对象引述。可以说,大数据策略投资的创业者们无一不是席勒的信奉者。

席勒于上世纪80年代设计的投资模型至今仍被业内称道。在他的模型中,主要参考三个变量:投资项目计划的现金流、公司资本的估算成本、股票市场对投资的反应(市场情绪)。他认为,市场本身带有主观判断因素,投资者情绪会影响投资行为,而投资行为直接影响资产价格。
然而,在大数据技术诞生之前,市场情绪始终无法进行量化。

回顾人类股票投资发展史,其实就是将影响股价的因子不断量化的过程。

上世纪70年代以前,股票投资是一种定性的分析,没有数据应用,而是一门主观的艺术。随着电脑的普及,很多人开始研究驱动股价变化的规律,把传统基本面研究方法用模型代替,市盈率、市净率的概念诞生,量化投资由此兴起。

量化投资技术的兴起也带动了一批华尔街大鳄的诞生。例如,巴克莱全球投资者(BGI)在上世纪70年代就以其超越同行的电脑模型成为全球最大的基金管理公司;进入80年代,另一家基金公司文艺复兴(Renaissance)年均回报率在扣除管理费和投资收益分成等费用后仍高达34%,堪称当时最佳的对冲基金,之后十多年该基金资产亦十分稳定。

“从主观判断到量化投资,是从艺术转为科学的过程。”王政表示,上世纪70年代以前一个基本面研究员只能关注20只到50只股票,覆盖面很有限。有了量化模型就可以覆盖所有股票,这就是一个大的飞跃。此外,随着计算机处理能力的发展,信息的用量也有一个飞跃变化。过去看三个指标就够了,现在看的指标越来越多,做出的预测越来越准确。

随着21世纪的到来,量化投资又遇到了新的瓶颈,就是同质化竞争。各家机构的量化模型越来越趋同,导致投资结果同涨同跌。“能否在看到报表数据之前,用更大的数据寻找规律?”这是大数据策略创业者们试图解决的问题。

于是,量化投资的多米诺骨牌终于触碰到了席勒理论的第三层变量——市场情绪。

计算机通过分析新闻、研究报告、社交信息、搜索行为等,借助自然语言处理方法,提取有用的信息;而借助机器学习智能分析,过去量化投资只能覆盖几十个策略,大数据投资则可以覆盖成千上万个策略。

基于互联网搜索数据和社交行为的经济预测研究,已逐渐成为一个新的学术热点,并在经济、社会以及健康等领域的研究中取得了一定成果。在资本市场应用上,研究发现搜索数据可有效预测未来股市活跃度(以交易量指标衡量)及股价走势的变化。

海外就有学术研究指出,公司的名称或者相关关键词的搜索量,与该公司的股票交易量正相关。德国科学家Tobias Preis就进行了如此研究:Tobias利用谷歌搜索引擎和谷歌趋势(Google Trends),以美国标普500指数的500只股票为其样本,以2004年至2010年为观察区间,发现谷歌趋势数据的公司名称搜索量和对应股票的交易量,在每周一次的时间尺度上有高度关联性。也就是说,当某个公司名称在谷歌的搜索量活动增加时,无论股票的价格是上涨或者下跌,股票成交量与搜索量增加;反之亦然,搜索量下降,股票成交量下降。以标普500指数的样本股为基础,依据上述策略构建的模拟投资组合在六年的时间内获得了高达329%的累计收益。

在美国市场上,还有多家私募对冲基金利用Twitter和Facebook的社交数据作为反映投资者情绪和市场趋势的因子,构建对冲投资策略。利用互联网大数据进行投资策略和工具的开发已经成为世界金融投资领域的新热点。

保罗·霍丁管理的对冲基金Derwent成立于2011年5月,注册在开曼群岛,初始规模约为4000万美元, 2013年投资收益高达23.77%。该基金的投资标的包括流动性较好的股票及股票指数产品。
通联数据董事长肖风在《投资革命》中写道,Derwent的投资策略是通过实时跟踪Twitter用户的情绪,以此感知市场参与者的“贪婪与恐惧”,从而判断市场涨跌来获利。

在Derwent的网页上可以看到这样一句话:“用实时的社交媒体解码暗藏的交易机会。”保罗·霍丁在基金宣传册中表示:“多年以来,投资者已经普遍接受一种观点,即恐惧和贪婪是金融市场的驱动力。但是以前人们没有技术或数据来对人类情感进行量化。这是第四维。Derwent就是要通过即时关注Twitter中的公众情绪,指导投资。”

另一家位于美国加州的对冲基金MarketPsych与汤普森·路透合作提供了分布在119个国家不低于18864项独立指数,比如每分钟更新的心情状态(包括乐观、忧郁、快乐、害怕、生气,甚至还包括创新、诉讼及冲突情况等),而这些指数都是通过分析Twitter的数据文本,作为股市投资的信号。

此类基金还在不断涌现。金融危机后,几个台湾年轻人在波士顿组建了一家名为FlyBerry的对冲基金,口号是“Modeling the World(把世界建模)”。它的投资理念全部依托大数据技术,通过监测市场舆论和行为,对投资做出秒速判断。

关于社交媒体信息的量化应用,在股票投资之外的领域也很常见:Twitter自己也十分注重信息的开发挖掘,它与DataSift和Gnip两家公司达成了一项出售数据访问权限的协议,销售人们的想法、情绪和沟通数据,从而作为顾客的反馈意见汇总后对商业营销活动的效果进行判断。从事类似工作的公司还有DMetics,它通过对人们的购物行为进行分析,寻找影响消费者最终选择的细微原因。

回到股票世界,利用社交媒体信息做投资的公司还有StockTwits。打开这家网站,首先映入眼帘的宣传语是“看看投资者和交易员此刻正如何讨论你的股票”。正如其名,这家网站相当于“股票界的Twitter”,主要面向分析师、媒体和投资者。它通过机器和人工相结合的手段,将关于股票和市场的信息整理为140字以内的短消息供用户参考。

此外,StockTwits还整合了社交功能,并作为插件可以嵌入Twitter、Facebook和LinkedIn等主要社交平台,让人们可以轻易分享投资信息。

另一家公司Market Prophit也很有趣。这家网站的宣传语是“从社交媒体噪音中提炼市场信号”。和StockTwits相比,Market Prophit更加注重大数据的应用。它采用了先进的语义分析法,可以将Twitter里的金融对话量化为“-1(极度看空)”到“1(极度看多)”之间的投资建议。网站还根据语义量化,每天公布前十名和后十名的股票热度榜单。网站还设计了“热度地图”功能,根据投资者情绪和意见,按照不同板块,将板块内的个股按照颜色深浅进行标注,谁涨谁跌一目了然。

中国原创大数据指数

尽管大数据策略投资在美国貌似炙手可热,但事实上,其应用尚仅限于中小型对冲基金和创业平台公司。大数据策略投资第一次被大规模应用,应归于中国的百发100。

网络金融中心相关负责人表示,与欧美等成熟资本市场主要由理性机构投资者构成相比,东亚尤其是中国的股票类证券投资市场仍以散户为主,因此市场受投资者情绪和宏观政策性因素影响很大。而个人投资者行为可以更多地反映在互联网用户行为大数据上,从而为有效地预测市场情绪和趋势提供了可能。这也就是中国国内公募基金在应用互联网大数据投资方面比海外市场并不落后、甚至领先的原因。

百发100指数由网络、中证指数公司、广发基金联合研发推出,于2014年7月8日正式对市场发布,实盘运行以来一路上涨,涨幅超过60%。跟踪该指数的指数基金规模上限为30亿份,2014年9月17日正式获批,10月20日发行时一度创下26小时疯卖18亿份的“神话”。

外界都知道百发100是依托大数据的指数基金,但其背后的细节鲜为人知。

百发100数据层面的分析分为两个层面,即数据工厂的数据归集和数据处理系统的数据分析。其中数据工厂负责大数据的收集分析,例如将来源于互联网的非结构化数据进行指标化、产品化等数据量化过程;数据处理系统,可以在数据工厂递交的大数据中寻找相互统计关联,提取有效信息,最终应用于策略投资。

“其实百发100是在传统量化投资技术上融合了基于互联网大数据的市场走势和投资情绪判断。”业内人士概括道。

和传统量化投资类似,百发100对样本股的甄选要考虑财务因子、基本面因子和动量因子,包括净资产收益率(ROE)、资产收益率(ROA)、每股收益增长率(EPS)、流动负债比率、企业价值倍数(EV/EBITDA)、净利润同比增长率、股权集中度、自由流通市值以及最近一个月的个股价格收益率和波动率等。

此外,市场走势和投资情绪是在传统量化策略基础上的创新产物,也是百发100的核心竞争力。接近网络的人士称,市场情绪因子对百发100基金起决定性作用。

网络金融中心相关负责人是罗伯特•席勒观点的支持者。他认为,投资者行为和情绪对资产价格、市场走势有着巨大的影响。因此“通过互联网用户行为大数据反映的投资市场情绪、宏观经济预期和走势,成为百发100指数模型引入大数据因子的重点”。

传统量化投资主要着眼点在于对专业化金融市场基本面和交易数据的应用。但在网络金融中心相关业务负责人看来,无论是来源于专业金融市场的结构化数据,还是来源于互联网的非结构化数据,都是可以利用的数据资源。因此,前文所述的市场情绪数据,包括来源于互联网的用户行为、搜索量、市场舆情、宏观基本面预期等等,都被网络“变废为宝”,从而通过互联网找到投资者参与特征,选出投资者关注度较高的股票。

“与同期沪深300指数的表现相较,百发100更能在股票市场振荡时期、行业轮动剧烈时期、基本面不明朗时期抓住市场热点、了解投资者情绪、抗击投资波动风险。”网络金融中心相关负责人表示。

百发100选取的100只样本股更换频率是一个月,调整时间为每月第三周的周五。

业内人士指出,百发100指数的月收益率与中证100、沪深300、中证500的相关性依次提升,说明其投资风格偏向中小盘。

但事实并非如此。从样本股的构成来说,以某一期样本股为例,样本股总市值6700亿元,占A股市值4.7%。样本股的构成上,中小板21只,创业板4只,其余75只样本股均为大盘股。由此可见,百发100还是偏向大盘为主、反映主流市场走势。

样本股每个月的改变比例都不同,最极端的时候曾经有60%进行了换仓。用大数据预测热点变化,市场热点往往更迭很快;但同时也要考虑交易成本。两方面考虑,网络最后测算认为一个月换一次仓位为最佳。

样本股对百发100而言是核心机密——据说“全世界只有基金经理和指数编制机构负责人两个人知道”——都是由机器决定后,基金经理分配给不同的交易员建仓买入。基金经理也没有改变样本股的权利。

展望未来,网络金融中心相关负责人踌躇满志,“百发100指数及基金的推出,只是我们的开端和尝试,未来将形成多样化、系列投资产品。”

除了百发100,目前市场上打着大数据旗帜的基金还有2014年9月推出的南方-新浪I100和I300指数基金。

南方-新浪I100和I300是由南方基金、新浪财经和深圳证券信息公司三方联合编制的。和百发100类似,也是按照财务因子和市场情绪因子进行模型打分,按照分值将前100和前300名股票构成样本股。推出至今,这两个指数基金分别上涨了10%左右。

正如百发100的市场情绪因子来自网络,南方-新浪I100和I300的市场情绪因子全部来自新浪平台。其中包括用户在新浪财经对行情的访问热度、对股票的搜索热度;用户在新浪财经对股票相关新闻的浏览热度;股票相关微博的多空分析数据等。

此外,阿里巴巴旗下的天弘基金也有意在大数据策略上做文章。据了解,天弘基金将和阿里巴巴合作,推出大数据基金产品,最早将于2015年初问世。

天弘基金机构产品部总经理刘燕曾对媒体表示,“在传统的调研上,大数据将贡献于基础资产的研究,而以往过度依赖线下研究报告。大数据将视野拓展至了线上的数据分析,给基金经理选股带来新的逻辑。”

在BAT三巨头中,腾讯其实是最早推出指数基金的。腾讯与中证指数公司、济安金信公司合作开发的“中证腾安价值100指数”早在2013年5月就发布了,号称是国内第一家由互联网媒体与专业机构编制发布的A股指数。不过,业内人士表示,有关指数并没有真正应用大数据技术。虽然腾讯旗下的微信是目前最热的社交平台,蕴藏了大量的社交数据,但腾讯未来怎么开发,目前还并不清晰。

大数据投资平台化

中欧商学院副教授陈威如在其《平台战略》一书中提到,21世纪将成为一道分水岭,人类商业行为将全面普及平台模式,大数据金融也不例外。

然而,由于大数据模型对成本要求极高,就好比不可能每家公司都搭建自己的云计算系统一样,让每家机构自己建设大数据模型,从数据来源和处理技术方面看都是不现实的。业内人士认为,大数据未来必将成为平台化的服务。

目前,阿里、网络等企业都表示下一步方向是平台化。

蚂蚁金服所致力搭建的平台,一方面包括招财宝一类的金融产品平台,另一方面包括云计算、大数据服务平台。蚂蚁金服人士说,“我们很清楚自己的优势不是金融,而是包括电商、云计算、大数据等技术。蚂蚁金服希望用这些技术搭建一个基础平台,把这些能力开放出去,供金融机构使用。”

网络亦是如此。接近网络的人士称,未来是否向平台化发展,目前还在讨论中,但可以确定的是,“网络不是金融机构,目的不是发产品,百发100的意义在于打造影响力,而非经济效益。”
当BAT还在摸索前行时,已有嗅觉灵敏者抢占了先机,那就是通联数据。

通联数据股份公司(DataYes)由曾任博时基金副董事长肖风带队创建、万向集团投资成立,总部位于上海,公司愿景是“让投资更容易,用金融服务云平台提升投资管理效率和投研能力”。该平台7月上线公测,目前已拥有130多家机构客户,逾万名个人投资者。

通联数据目前有四个主要平台,分别是通联智能投资研究平台、通联金融大数据服务平台、通联多资产投资管理平台和金融移动办公平台。

通联智能投资研究平台包括雅典娜-智能事件研究、策略研究、智能研报三款产品,可以对基于自然语言的智能事件进行策略分析,实时跟踪市场热点,捕捉市场情绪。可以说,和百发100类似,其核心技术在于将互联网非结构化数据的量化使用。

通联金融大数据服务平台更侧重于专业金融数据的分析整理。它可以提供公司基本面数据、国内外主要证券、期货交易所的行情数据、公司公告数据、公关经济、行业动态的结构化数据、金融新闻和舆情的非结构化数据等。

假如将上述两个平台比作“收割机”,通联多资产投资管理平台就是“厨房”。在这个“厨房”里,可以进行全球跨资产的投资组合管理方案、订单管理方案、资产证券化定价分析方案等。

通联数据可以按照主题热点或者自定义关键字进行分析,构建知识图谱,将相关的新闻和股票提取做成简洁的分析框架。例如用户对特斯拉感兴趣,就可以通过主题热点看到和特斯拉相关的公司,并判断这个概念是否值得投资。“过去这个搜集过程要花费几天时间,现在只需要几分钟就可以完成。”王政表示。

“通联数据就好比一家餐馆,我们把所有原料搜集来、清洗好、准备好,同时准备了一个锅,也就是大数据存储平台。研究员和基金经理像厨师一样,用原料、工具去‘烹制’自己的策略。”王政形容道。

大数据在平台上扮演的角色,就是寻找关联关系。人类总是习惯首先构建因果关系,继而去倒推和佐证。机器学习则不然,它可以在海量数据中查获超越人类想象的关联关系。正如维克托`迈尔-舍恩伯格在《大数据时代》中所提到的,社会需要放弃它对因果关系的渴求,而仅需关注相互关系。

例如,美国超市沃尔玛通过大数据分析,发现飓风用品和蛋挞摆在一起可以提高销量,并由此创造了颇大的经济效益。如果没有大数据技术,谁能将这毫无关联的两件商品联系在一起?
通联数据通过机器学习,也能找到传统量化策略无法发现的市场联系。其中包括各家公司之间的资本关系、产品关系、竞争关系、上下游关系,也包括人与人之间的关系,例如管理团队和其他公司有没有关联,是否牵扯合作等。

未来量化研究员是否将成为一个被淘汰的职业?目前研究员的主要工作就是收集整理数据,变成投资决策,而之后这个工作将更多由机器完成。

“当初医疗科技发展时,人们也认为医生会被淘汰,但其实并不会。同理,研究员也会一直存在,但他们会更注重深入分析和调研,初级的数据搜集可以交给机器完成。”王政表示。
但当未来大数据平台并广泛应用后,是否会迅速挤压套利空间?这也是一个问题。回答根据网上资料整理

❿ 基于微信大数据的股票预测研究

基于微信大数据的股票预测研究
大数据是近些年来的热门话题,无论国际上还是国内,影响很大。经济学、政治学、社会学和许多科学门类都会发生巨大甚至是本质上的变化和发展,进而影响人类的价值体系、知识体系和生活方式。而全球经济目前生成了史无前例的大量数据,如果把每天产生的大量数据比作神话时期的大洪水是完全正确的,这个数据洪流是我们前所未见的,他是全新的、强大的、当然,也是让人恐慌但又极端刺激的。
而我所分享的话题,正是在互联网环境下,如何利用大数据技术,进行股票预测的研究。–今天,我想分享我认为有意义的四点。
1.大数据下的商业预测
根据大数据,我们可以有效地进行故障、人流、流量、用电量、股票市场、疾病预防、交通、食物配送、产业供需等方面的预测。而本文我们所关心的内容是股票市场的预测。
大数据的核心是预测,预测依赖于对数据的分析。那么分析的方法是否是基于随机采样的结果而设计的,这样的分析方法是否会有误差?
从传统认识上,由于资源和科技的局限,如人和计算资源受限、从计算机处理能力来讲无法处理全部数据来获取人们所关注的结果。因此随机采样应运而生,通过所选取的个体来代表全体,如使用随机抽取的方式来使得推论结果更科学。但既然提到了大数据,它是资源发展到一定程度、以及技术发展到一定阶段产生的一个新的认识。如同电力的出现,使人类进入了一个快速发展阶段,大数据也一样,它的含义是全体样本,从整体样本来做推论。在本文大数据的含义是所有股票在整个社交网络上的流动信息,从数据源上讲,本文没有采用所有社交网络上的数据,只分析了微信这个最具代表性的社交媒体作为信息源。
互动数据能反映用户情绪,搜索数据能反映用户的关注点和意图,在股市预测时这两种数据哪种更具有参考价值?
我认为都有价值,互动数据反映了用户对某一特定股票的喜好和厌恶,可以简单描述为对该股票的操作是继续持有还是卖出;而搜索数据则代表用户在收集该股票信息的过程,它是关注度的概念,某只股票搜索度高则意味着消息的影响力大。互动代表着方向,搜索代表着振幅。
我们知道这两种数据得出的结论会有差异,您是如何平衡这两种数据反映的情况来进行预测的?
正如上一个问题里提到的,如果是股票推荐,买进卖出等原则问题,则应该考虑互动数据,但如果已经买到手了,搜索数据可以提供一个幅度的概念,类似债券评级A级、AA级、AAA级等,供投资者参考,因为不同投资者对风险的承受度是不同的。
将股票和市场的消息整理成140字的短消息发布,是否意味着主要发布渠道是微博?现在微信公众号很火,有没有考虑通过这个渠道也发布消息?
事实上,信息传播的方式很多,微信作为新媒体当然影响力不容小觑,但目前技术投入最小的还是邮件、短信等方式,未来会考虑使用公众号来推送股票和市场消息。
如果在未来通过微信公众号推送消息,那么推送的消息会不会作为数据来源被再次采集?这会有多大的影响?
会被采集,但互联网上的每日关于个股的信息数量会达到很大,该推送会增加推荐股票1点权重,每只股票的权重成百上千,因此影响极小。
数据来源是微信公众号,除了准确性的考虑之外,是否还考虑过这样收集数据会较少触犯个人隐私?
从法律角度来看,搜索微信或其他个人聊天记录,是侵犯个人隐私权的,因此如果腾讯开放了这样的接口,每个公民都可以对这样的行为进行投诉、抗议、甚至进行法律起诉直至其改正过错、赔偿损失的。
这样是否意味着即使存在违法的行为,其结果也是由腾讯来承担,而我们作为数据的使用方不需要承担任何法律责任?
在整个社会,我们作为系统技术提供方,应恪守大数据的伦理道德,遵守国家法律,如侵犯个人隐私,系统不会采集,谷歌有一句座右铭“谷歌不作恶”,本文提到的系统也一样。
2.基于大数据进行股票推荐实验
股票的及时度反应了微信文章所发布的时效性,及时度越高,数据价值就越大。
股票的热度反应了当前某只股票被关注的频度,关注频度越大,上涨的可能性越高。

数据的完整性:我们采用循环的方式对所有深沪两地发行约2236只股票(创业版除外)在微信搜索网站上的搜索结果进行保存。
数据的一致性:文件格式由负责保存数据文件的程序决定,单一的流程保障了文件的一致性。
数据的准确性:由于所分析的订阅号文章的是由微信公共平台的公众号所提供,在一定程度上杜绝了虚假消息对于预测系统的破坏。
数据的及时性:考虑到磁盘读写以及采集程序所处的网络带宽,以及搜索引擎对于采集程序的屏蔽,程序中采集两条信息之间间隔了5秒,因此理论上11180秒(3.1个小时)可收集完当日推荐所需要的数据。对于每个交易日,在9点-9点30分之间采集所有数据,需要7台以上的设备可达到最佳效果。本次试验受限于试验设备,在一台设备上,交易日每天早六时开始进行数据采集,也满足及时性要求。
数据分析:查看三个高优先级的股票,该股票当日的开盘价与收盘价,再与当日(2015-4-8)上证综指进行比较,可得在收益上该算法是优于上证综指为样本的整体股票的股价差收益的。
实验结论:按照上述方式,系统每天推荐出当日股票,在开盘时进行买进,在第二个交易日进行卖出。经过一个月21个交易日(2015-3-1至2015-3-31),系统的收益为20%/月。通过微信搜索公众号来预测市场走势和投资情绪呈现出正相关性,因此可以作为股票甄选的因子。
3.股票预测的大数据发展趋势
网络数据分成三种:
一是浏览数据,主要用于电商领域的消费者行为分析,浏览数据反映了用户每一步的访问脚步,进一步刻画出用户的访问路径,分析不同页面的跳转概率等。
二是搜索数据,主要指搜索引擎记录的关键词被搜索频次的时间序列数据,能反映数亿用户的兴趣、关注点、意图。
三是互动数据,主要是微博、微信、社交网站的数据,反映用户的倾向性和情绪因素。
2013年诺贝尔经济学奖得主罗伯特?席勒的观点被无数采访对象引述。席勒于上世纪80年代设计的投资模型至今仍被业内称道。在他的模型中,主要参考三个变量:投资项目计划的现金流、公司资本的估算成本、股票市场对投资的反应(市场情绪)。他认为,市场本身带有主观判断因素,投资者情绪会影响投资行为,而投资行为直接影响资产价格。
计算机通过分析新闻、研究报告、社交信息、搜索行为等,借助自然语言处理方法,提取有用的信息;而借助机器学习智能分析,过去量化投资只能覆盖几十个策略,大数据投资则可以覆盖成千上万个策略。
基于互联网搜索数据和社交行为的经济预测研究,已逐渐成为一个新的学术热点,并在经济、社会以及健康等领域的研究中取得了一定成果。在资本市场应用上,研究发现搜索数据可有效预测未来股市活跃度(以交易量指标衡量)及股价走势的变化。
对于搜索数据:互联网搜索行为与股票市场的关联机理。这个研究属于行为金融与互联网的交叉领域,其原理是:股票量价调整是投资者行为在股票市场上的反应;与此同时,投资者行为在互联网搜索市场也有相应地行为迹象,我们要做到是:找到互联网搜索市场中领先于股票交易的行为指标,综合众多投资者的先行搜索指标,对未来的股票交易做出预判。
如同天气预报那样,不断优化模型、灌入海量信息,然后给出结果。并且在处理的信息中,有80%是“非结构化”数据,例如政策文件、自然事件、地理环境、科技创新等,这类信息通常是电脑和模型难以消化的。采用了语义分析法,可以将互动数据里的金融对话量化为“-1(极度看空)”到“1(极度看多)”之间的投资建议,通过分析互动数据的数据文本,作为股市投资的信号。
4.正在发生的未来
大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的将来。
大数据在实用层面的影响很广泛,解决了大量的日常问题。大数据更是利害攸关的,它将重塑我们的生活、工作和思维方式。在某些方面,我们面临着一个僵局,比其他划时代创新引起的社会信息范围和规模急剧扩大所带来的影响更大。我们脚下的地面在移动。过去确定无疑的事情正在受到质疑。大数据需要人们重新讨论决策、命运和正义的性质。拥有知识曾意味着掌握过去,现在则意味着能够预测未来。
大数据并不是一个充斥着算法和机器的冰冷世界,其中仍需要人类扮演重要角色。人类独有的弱点、错觉、错误都是十分必要的,因为这些特性的另一头牵着的是人类的创造力、直觉和天赋。这提示我们应该乐于接受类似的不准确,因为不准确正是我们之所以为人的特征之一。就好像我们学习处理混乱数据一样,因为这些数据服务的是更加广大的目标。必将混乱构成了世界的本质,也构成了人脑的本职,而无论是世界的混乱还是人脑的混乱,学会接受和应用他们才能得益。
我相信,利用基础数据、搜索数据、互动数据再进行加权计算,可以对所有股票进行大数据遴选,从而给出投资建议。我认为,我们的肉身刚刚步入大数据时代,但我们的精神还滞留在小数据、采样思维之中,率先用理性击碎固有思维的人,也将率先获得大数据带来的益处。