深度学习
2026/4/1大约 2 分钟
写在前面
大一暑假开始我开始接触这方面知识,不过那时候并未系统学习机器学习,属于有点囫囵吞枣。
- 我先是从吴恩达的老师的机器学习入门课程开始,b站上就有,然后写下了第一篇笔记
- 然后学习小土堆的pytorch视频,写下了第一篇pytorch笔记
- 接着学习李沐老师的动手学深度学习
- 接着作罢,没再学习下去,因为开学了,卷绩点了
断断续续接触了LLM、CV,开始有了初步认识,从我叔那里得知生成式模型,不知天高地厚开啃VAE和扩散模型,太特么难了,没啃完
大一暑假开始做大创,老师给的课题方向是LLM和知识图谱,按要求做了APP,和这方向不沾边,后面越走越偏,学不到东西,作罢
大二暑假前看了李宏毅老师22年的课程,做了笔记
大二暑假去了个小厂实习,算是对这方面有了见解,自己用之前学的知识用FastAPI搭了个接口,然后胡塞一堆中间件,Redis,Celery,把微调好的模型用VLLM一塞,也不知道后面落地能不能用上,九月份做完就离职了
- 在这期间系统性学了LLM,还有一些分布式训练知识,注意力机制变体等,学会了手写MHA
- 无聊的时候复现了一些卷积神经网络,跟着b站视频读了些文献
我还是蛮想搞算法的,奈何没资源,学历也不够好,也不知道研究生去哪里读,目前这方面学习也停滞了,打算读研再继续吧
