Skip to content

lihanghang/ML

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

69 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🚀 机器学习技术实践 🚀

created time 2019-04-23
Python默认使用3.11 版本,其他版本可能存在兼容问题,请自行修改。
⚠ 注意:本仓库代码为实验调试记录,建议结合具体场景参考使用.

🧠ML内容--工程测试代码

📂 各文件说明

  • attention&&memory:基于注意力机制和记忆网络的企业信用评级与科研投入模型构建
  • CNN
    • 手写数字识别实验
    • 企业信用评级CNN模型构建(输出见out文件夹)
  • GAN:生成手写数字的对抗神经网络实验
  • gcForestTest:周志华团队多粒度级联森林算法实现
  • MemNN:记忆网络实验
  • MINST_DATA:手写数字数据集
  • ML_Demo:PM2.5预测、反欺诈检测等机器学习实验
  • NLP:基于卷积神经网络的文本情感分析
  • RBM:受限玻尔兹曼机手写数字实验
  • RiskPredict:CNN企业风险分析模型
  • RNN:行业风险分析(含ARIMA方法),覆盖汽车/信息服务/房地产行业

🔍实例代码

访问ML Demo

  1. 机器学习实验,关于CNN、RNN、GAN等神经网络算法的入门、中级、高级运用,运用在图像处理或医疗诊断等领域
  2. 机器学习基础0108(regression、classification)
  3. ML中回归、分类问题实例:
    • PM2.5各成分影响比重分析及预测未来几日PM2.5浓度值
    • E-mail反究欺诈预测
  4. 记忆神经网络研学习(0506)

Neural Network算法在MNIST上的实践

1. CNN实验

  • 利用卷积神经网络对手写体数字进行训练测试,使用2层神经网络的准确率为92.42%。

2. RNN实验

  • 利用循环神经网络同样对手写体数字进行训练测试,准确率高达97.99%,从我的实验数据来分析明显高于卷积神经网络。

3. GAN实验

  1. 生成式对抗网络生成手写数字图片,即教会神经网络算法自己学习写数字。(nivdia k80 GPU)
  2. 在进行训练算法时,由于在远程服务器运行,本地调试,对于图像化显示就出现了错误,最后找到一个可行的方案就是在本地安装Xming软件并在 服务器端设置环境变量其中的将图像显示指向本地的ip:0.0,前提是要保证服务器端ping通本地机器,如果无法连接本地机器可关闭本地防火墙后再次尝试 ,就能很好解决这个问题,我使用的Xshell连接远程服务器。
  3. 我用GAN教神经网路算法自己书写数字,在10000、20000、30000次的迭代下观察变化不是很大,而且也并不是迭代次数与输出结果有线性关系即次数越多并 不一定会增加训练结果的友好度,适当即可!

📊NLP情感分析实践

企业舆情分析

  1. 实践过程中,一是语料库不是很多,即便有数据量也不够大。那么没有数据,我们也不能随意创造数据。只有去寻找了。随即自己写个爬虫去爬
  2. 基于TensorFlow的keras进行建模。主要使用jieba分词、word2vector、知乎已训练的词向量等。
  3. 主要数据和代码

📖 推荐阅读

技术博客精选

🗂️ 日常基于Python的模型开发项目目录结构

.
├── conf/           # 配置
│   └── conf.ini
├── logs/           # 运行日志
├── dataSets/       # 数据集
├── save_model/     # 模型存储
├── config.py       # 超参数配置
├── model.py        # 模型定义
├── train.py        # 训练入口
├── test.py         # 测试入口
├── utils.py        # 数据预处理工具
└── README.md

👉个人文章地址

📌update 2025022 create by lihanghang