2024经济与金融数据课堂 开讲了~~
事实数据之于经管、社会科学学者,就像科学实验之于理工科研究者,是进行学术研究的事实数据基础。数据课堂旨在提升大家的数据获取和使用能力,使大家不仅知道从哪里获取数据,如何获取数据,同时学会判断所获取数据的质量,挖掘深藏在数据背后的逻辑,全方位提高数据素养。欢迎老师、同学们积极参与数据课堂培训,并为办好数据课堂出谋划策……
第二讲 基于大语言模型开展经管领域研究
【主 讲 人】 陈芷怡
【讲座时间】 2024年3月22日下午2:00
【讲座方式】 腾讯会议:193-126-732
会议网址:https://meeting.tencent.com/dm/IX9S0S8tQKf6
【讲座内容】 :
1、文本分析的基本概念与研究框架
2、自然语言处理技术的演变(传统词袋法—深度学习—大语言模型)
3、以BERT/GPT为例,介绍如何基于大语言模型构建文本指标
4、简介文构数据库基于大语言模型的最新文本指标
【数据库介绍】
WinGo财经文本数据平台(中文名为“文构财经文本数据平台”)是中国首家基于中美上市公司披露文本的人工智能财经数据平台。平台立足于学术研究和业界量化投资,聚焦于中美海量财经文本数据。针对两国截然不同的文本披露规则和财经文本特点,平台应用自然语言处理、深度学习和人工智能技术对财经文本进行深度加工,为用户提供财经文本的词频、句频、相似词、预计算文本特征等全新深度处理的数据,从而为学术研究、量化投资、监管决策等提供多方位支持。
WinGo数据平台包括中国上市公司、美国上市公司、中国政府文本、专利文本以及大语言模型五大数据库,由业内专家和高校知名学者主持设计,打破了财经文本分析的技术壁垒,大幅降低研究成本,为广大研究和分析人员开辟出全新的研究模式。
清华大学目前订购了WinGo基础版数据产品中的中国上市公司文本数据库、中国政府文本数据库、专利数据库中的大部分数据,和美国上市公司文本数据库中的季报数据。
【数据库说明页】
https://ecollection.lib.tsinghua.edu.cn/databasenav/entrance/detail?mmsid=991021558927003966
【主讲人简介】
陈芷怡,西安交通大学会计财务系博士,主要研究方向为财经领域的大数据和人工智能应用。