# 番茄时间 *** 5. 大模型面试50问 6. 自己动手学深度学习 4. 介绍一下当前主流的大模型结构是如何组成的? 5. 介绍一下当前的GPT大模型的结构包括哪些部分? 6. 介绍下大模型的多头注意力机制 7. 什么是大模型MOE结构 8. 知识蒸馏的步骤是什么 9. 知识蒸馏中的教师模型和学生模型有什么区别 10. 什么是分组混合并行训练方法 11. 混合专家MOE的基本原理是什么 4. 写一篇关于大模型应用的论文 5. 看transformer代码 docker run -itd -p 17860:7860 -p 18022:22 -v /ai_home/zhaojingteng:/root/zhaojingteng --name=zjt_chat --gpus='"device=5,6,7"' nvidia/cuda:12.1.0-cudnn8-devel-ubuntu20.04 docker run -itd -p 8084:63000 -v /ai_home/zhongjiayi/gpu_server:/root/nlp_test --name=nlp_test docker run -itd -p 8063:22 -v /home/ubuntu/PaddleFaq/r_base:/root/r_base --security-opt seccomp:unconfined --name=r_base r-base-self:1.0 192.168.210.83 255.255.255.0 # 备忘 --- 飞天: 111.198.66.100 shuju Aa123Bb456 101.200.228.213 LiYanpeng_DaoHang thinkit123 GPU 103.116.120.16 ubuntu speech,123 10.20.1.208 nlp speech,123 kubectl get pods -n nlp kubectl exec -it nlp-3-86845b5f54-4t7ch -n nlp -- bash kubectl get svc -n nlp --查最高内存 ps auxw | head -1;ps auxw|sort -rn -k4|head -5 https://agit.ai/ddx/TVBox/raw/branch/master/t4.json http://pandown.pro/tvbox/tvbox.json https://agit.ai/Yoursmile7/TVBox/raw/branch/master/live.txt # 代理到本机的指定端口(公网服务器) export https_proxy=http://10.126.126.3:12334;export http_proxy=http://10.126.126.3:12334;export all_proxy=socks5://10.126.126.3:12334 # 取消使用代理服务器 unset http_proxy;unset https_proxy;unset all_proxy # 测试服务器是否可用 curl -v google.com [Service] Environment="HTTP_PROXY=http://10.126.126.2:12334" Environment="HTTPS_PROXY=http://10.126.126.2:12334" Environment="NO_PROXY=localhost,127.0.0.1,.example.com"