《投资学》是由三名美国知名学府的著名金融学教授撰写的优秀著作,是美国最好的商学院和管理学院的首选教材,在世界各国都有很大的影响,被广泛使用。
自1999年《投资学》第4版以及2002年的第5版翻译介绍进中国以后,在国内的大学里,本书同样得到广泛运用和热烈反响。
此为本书的第6版,作者在前5版的基础上根据近年来金融市场、投资环境的变化和投资理论的最新进展做了大幅度的内容更新和补充,还充分利用了网络资源为使用者提供了大量网上资料。
全书共分7大部分,27章。
详细讲解了投资领域中的风险组合理论、资本资产定价模型、套利定价理论、市场有效性、证券评估、衍生证券、资产组合管理等重要内容。
数学是基础工具,金融是金融工具,技术是实现手段。
而人才是目的。
经典书籍
视频
《货币经济学》
书籍
《投资学》
《计量经济学导论》
《Trends in quantitative finance》
《漫步华尔街》
《海龟交易法则》
《打开量化交易投资的黑箱》
《量化交易-如何建立自己的算法交易事业》
《博弈论》
《心理学》
开源框架
数据的来源
别人整理好的
同花顺
东方(南方)财富网
...
其他:
类似的网站很多,顺便找一个比较好抓取的。
实例抓取代码
# -*- coding: utf-8 -*-
# 导入BeautifulSoup和requests模块
from bs4 import BeautifulSoup
import requests
import os
# 获取字符串格式的html_doc。由于content为bytes类型,故需要decode()
url = "https://hq.gucheng.com/gpdmylb.html"
html_doc = requests.get(url).content.decode()
# 使用BeautifulSoup模块对页面文件进行解析
soup = BeautifulSoup(html_doc, 'html.parser')
# 查找所有tag为'a'的html元素,并生成列表
links = soup.find('section', {'class':'stockTable'}).find_all('a')
# 获取每个元素中'href'键对应的键值--即URL,并放入url_lst
url_lst = []
for item in links:
# url = item.get('href')
url = item.contents[0]+","+item.get('href')+"\n"
url_lst.append(url)
# 过滤url_lst--仅保留包含http的URL
# url_lst = list(filter(lambda url_str: 'http' in url_str, url_lst))
# 写入到文件
with open('stock_base.data', 'w') as f:
f.writelines(url_lst)
Tushare是一个免费、开源的python财经数据接口包。
主要实现对股票等金融数据从数据采集、清洗加工 到 数据存储的过程,能够为金融分析人员提供快速、整洁、和多样的便于分析的数据,为他们在数据获取方面极大地减轻工作量,使他们更加专注于策略和模型的研究与实现上。
考虑到Python pandas包在金融量化分析中体现出的优势,Tushare返回的绝大部分的数据格式都是pandas DataFrame类型,非常便于用pandas/NumPy/Matplotlib进行数据分析和可视化。当然,如果您习惯了用Excel或者关系型数据库做分析,您也可以通过Tushare的数据存储功能,将数据全部保存到本地后进行分析。应一些用户的请求,从0.2.5版本开始,Tushare同时兼容Python 2.x和Python 3.x,对部分代码进行了重构,并优化了一些算法,确保数据获取的高效和稳定。
使用场景
数据科学家
连接到一系列来源,与其他用户协作,只需单击按钮即可部署项目。
IT专业人士
安全地从单个笔记本电脑扩展和部署到协作团队,从单个服务器到数千个节点。
商业领袖
以当今数字互动所需的速度利用数据科学,机器学习和人工智能的力量。
概述
很多学习python的初学者甚至学了有一段时间的人接触到anaconda或者其他虚拟环境工具时觉得无从下手, 其主要原因就是不明白这些工具究竟有什么用, 是用来做什么的, 为什么要这么做, 比如笔者一开始也是不明白为啥除了python之外我还需要这么一个东西, 他和python到底有啥联系和区别, 为啥能用来管理python.
全系使用python实现。因为都是python的类库,互相之间调用方便。
从数据抓取,数据处理,到数据展示数据运算都是python实现。
最终的数据都到前端展示出来。主要分为4个文件夹。
jobs 抓取数据并存储实现类。
libs 通用工具类。
web 前端展示框架。
tf 机器学习文件夹,推测数据。
项目使用hdf5 数据格式进行存储。如果要是单机跑数据。需要将服务部署到一起。
要是分布式部署需要使用 nfs 或者存储到,分布式的文件系统上。
将服务拆分。分开跑数据。
分类
python可视化库可以大致分为几类:
基于matplotlib的可视化库
pandas is an open source, BSD-licensed library providing high-performance, easy-to-use data structures and data analysis tools for the Python programming language.
pandas is a NumFOCUS sponsored project.