Skip to content

关于数据化决策你所需要知道的一切

Everything You Need to Know About Data-Driven Decision Making

License: CC BY-SA 4.0 Python Status

📚 一本关于数据化决策的百科全书式指南 - 从理论基础到实战应用,从工具使用到思维方法,覆盖数据科学全流程的知识库。


📖 项目愿景

本项目旨在成为数据化决策领域最全面的中文知识库,服务于:

  • 🎯 初学者 - 系统化的学习路径和基础概念讲解
  • 💼 从业者 - 实用工具、方法和最佳实践参考
  • 🎓 进阶者 - 深入的理论推导和前沿技术探索
  • 👨‍💼 决策者 - 数据驱动的管理思维和案例参考

🗺️ 知识地图

graph TB
    A[数据化决策] --> B[基础理论]
    A --> C[工具与技术]
    A --> D[方法论]
    A --> E[实战案例]
    A --> F[资源汇总]

    B --> B1[数学基础]
    B --> B2[统计学]
    B --> B3[编程基础]

    C --> C1[Python]
    C --> C2[SQL]
    C --> C3[可视化]
    C --> C4[机器学习]

    D --> D1[数据分析流程]
    D --> D2[A/B 测试]
    D --> D3[因果推断]
    D --> D4[实验设计]

    E --> E1[商业分析]
    E --> E2[用户分析]
    E --> E3[产品分析]
    E --> E4[运营分析]

    F --> F1[书籍]
    F --> F2[课程]
    F --> F3[工具]
    F --> F4[数据集]

📚 内容结构

第一部分:基础理论

主题 状态 描述
线性代数 📝 待撰写 矩阵运算、特征值、SVD 等
微积分 📝 待撰写 导数、积分、优化基础
概率论 📝 待撰写 概率分布、贝叶斯定理
统计学基础 📝 待撰写 描述统计、推断统计
Python 编程 📝 待撰写 语法、数据结构、函数
SQL 基础 📝 待撰写 查询、聚合、连接

第二部分:工具与技术

主题 状态 描述
NumPy 📝 待撰写 数值计算核心库
Pandas 📝 待撰写 数据处理与分析
数据可视化 📝 待撰写 Matplotlib, Seaborn, Plotly
机器学习 📝 待撰写 Scikit-learn, XGBoost
深度学习 📝 待撰写 PyTorch, TensorFlow
大数据工具 📝 待撰写 Spark, Hadoop, Hive

第三部分:方法论

主题 状态 描述
决策方法论框架 ✅ 已完成 决策理论、行为经济学、分析成熟度
决策科学资源 ✅ 已完成 期望效用、前景理论、贝叶斯决策
决策工具模板 ✅ 已完成 SWOT、决策树、蒙特卡洛等 8 个工具
A/B 测试与实验设计 📝 待撰写 随机对照试验、因果推断
数据分析流程 📝 待撰写 从问题定义到洞察输出
指标体系设计 📝 待撰写 OMTM、北极星指标、AARRR

第四部分:实战案例

主题 状态 描述
行为经济学案例研究 ✅ 已完成 8 个经典商业失败案例的行为经济学分析
数据分析实战案例 ✅ 已完成 6 个数据分析成功案例(电商、SaaS、零售等)
电商用户行为分析 📝 待撰写 转化漏斗、留存分析
产品功能效果评估 📝 待撰写 A/B 测试实战
销售额预测 📝 待撰写 时间序列预测
用户流失预警 📝 待撰写 分类模型应用
推荐系统 📝 待撰写 协同过滤、深度学习
运营数据分析 📝 待撰写 库存、供应链优化

第五部分:资源汇总

主题 状态 描述
精选参考资料库 ✅ 已完成 GitHub 项目、书籍、课程汇总
决策科学资源 ✅ 已完成 决策理论、行为经济学、风险量化
决策工具模板 ✅ 已完成 8 大决策工具模板 + Python 实现
A/B 测试与因果推断 ✅ 已完成 实验设计资源专题
时间序列分析 ✅ 已完成 预测模型资源专题
SQL 与数据库分析 ✅ 已完成 SQL 进阶资源专题
数据可视化 ✅ 已完成 可视化设计与工具

🚀 快速开始

学习路径建议

🟢 入门阶段(0-6 个月)

1. Python/SQL 基础
2. 统计学基础
3. Pandas 数据处理
4. 基础可视化
5. 描述性分析

🟡 进阶阶段(6-18 个月)

1. 推断统计学
2. 机器学习基础
3. A/B 测试
4. 预测建模
5. 业务指标体系

🔴 高级阶段(18 个月+)

1. 因果推断
2. 深度学习
3. 实验设计
4. 大数据处理
5. 数据产品思维

代码示例

每个主题都包含可运行的代码示例:

# 示例:加载数据并进行描述性统计
import pandas as pd

df = pd.read_csv('data.csv')
print(df.describe())

完整的 Jupyter Notebook 示例可在 examples/ 目录找到。


🤝 参与贡献

我们欢迎各种形式的贡献:

  • ✍️ 内容撰写 - 分享你的专业知识和经验
  • 🔧 代码示例 - 提供可运行的示例代码
  • 🐛 问题反馈 - 指出错误或不清晰的地方
  • 📝 翻译校对 - 帮助改进表达和格式
  • 推广项目 - 星标、分享让更多人受益

详见 贡献指南


📄 许可证

本项目采用 CC BY-SA 4.0 许可证,您可以:

  • 共享 - 在任何媒介以任何形式复制、发行本作品
  • 演绎 - 修改、转换或以本作品为基础进行创作

条件: - 署名 - 您必须给出适当的署名 - 相同方式共享 - 您必须以相同的许可协议分发


📬 联系方式


🙏 致谢

感谢所有为数据科学开源社区做出贡献的人们。本项目参考和引用了众多优秀的开源项目、书籍和课程,详见 参考资料


**如果这个项目对您有帮助,请给一个 ⭐️ Star!** [返回顶部](#关于数据化决策你所需要知道的一切)