punchy
Stay foolish Stay hungry

Wudiudiu's Blog

Welcome to my Blog!
拼多多笔试
第一题拉火车每个人都有一副牌的一半,即26张,两个人玩拉火车的游戏,即轮流出牌,两个人分别叫alice和bob,轮流出牌构建一个序列,如果某个人出牌A时,前面的序列中有这张牌A1,则这个人将A1-A之间包括A1,A所有牌都收走,下一个人继续出牌。最后直到走完26张牌则游戏结束。结束时候比较谁的牌多即谁胜出。 我的解法12345678910111213141516171819202122232425262728293031323334353637383940import sysT = int(sys.stdin.readline().strip())for _ in range(T): a ...

uv_learn
包管理器:UV包管理器就是在python项目中,管理各种依赖的安装和卸载,环境的构建,方便开发者能够不被各种版本依赖困扰。uv是使用rust语言开发的一款包管理器,使用起来非常便捷,最大的感受是安装各种包的时候速度非常的快。 安装使用pipx安装 pipx install uv 使用uv新建一个项目 mkdir proj cd proj uv init:这会创建一个python项目所需要的所有文件 12345678910.├── .venv│   ├── bin│   ├── lib│   └── pyvenv.cfg├── .python-version├── README.md├── ...

docker-learn
从零开始安装docker engine打开终端,依次运行以下命令: 12## 删除原来安装的旧版本for pkg in docker.io docker-doc docker-compose docker-compose-v2 podman-docker containerd runc; do sudo apt-get remove $pkg; done 12345678910111213## 设置docker的apt软件源sudo apt-get updatesudo apt-get install ca-certificates curlsudo install -m 0755 -d /e ...

月总结5.27
本月工作总结 CAD插件的代码在GPT的帮助下完成了,功能还可以,起码作为一个demo来说是合格的 西北电的项目应该终于能接到了,接到之后就能暂时的喘一口气不管这边了 今天做了一份好未来的NLP算法实习生的笔试题,选择题较为简单,编程题两道,一道是不定长滑动窗口,一道是考递归,类似于斐波那契数列 机器人巡检的PPT还在继续做,宇树机器人的二次开发方案到底该怎么写啊 完善了一下废话模型的代码,发现llama-factory是真的好用啊,集成了训练,评估,推理,部署四个阶段,对于一个学生来说是绝对够用的。 多模态RAG的项目也算是阶段性的完成了,虽然部分想实现的功能没有实现。 下月工作展望 参加 ...

CAD_plugin总结

多模态RAG学习总结
python知识__init__.py的作用 该文件的存在最基本的作用是将当前目录标记为包,这样python解释器就知道这个目录及目录包含的文件应该被视为包 初始化包:当该包被导入的时候,会首先执行__init__.py,这样我们可以在其中写一些代码来做初始化 控制包的导入:一个包内部会有很多子模块,通过在__init__.py中导入子模块,我们可以控制from packege import *运行时,哪些模块会被导入。 包的命名空间管理:通过在__init__.py导入子模块,可以提供给外部一个精心设计的接口,比如在如下结构中: 12345my_package/│├── __init__. ...

周总结4.30
本周工作总结 设计院的PPT终于讲了,讲完之后还是觉得太学术了,甲方要求我们写的再细节一点,具体用什么模型,用什么技术,要写清楚 中兴的那个比赛成功提交了代码,应该是可以免笔试了,A榜大概1.31分,B榜5.5截止,在截止之前我觉得我还可以再试试提高 读博的事情终于有了定论,虽然我犹豫了很多次,但还是拒绝了。因为无论哪个师兄都不建议我读博。虽然我目前觉得陈老师各方面对我都很好,但是谁知道蜜月期过后,我会不会和戴师兄一样呢?和他相处最久的孟师兄,嘴里对他没有一句好话,凭什么我会认为他对我就不一样呢?他说的那些:“咱还是要干一些大事,钱不是问题”“我有清华的同学派一个团队来支持你”,这些太空的话我 ...

周总结4.21
本周工作总结 这周又改了一下电气设计院的那个PPT,终于算是改完了,下午要去讲,这项目不知道能不能接到,感觉有点悬。 今天周一上午面试了腾讯的大模型应用研究,感觉有点悬,kaggle的那个比赛我确实有点水,但比赛已经结束了,在纠结要不要在本地继续完善呢还是直接别写了,但我的项目确实不多啊 这周开始做灵神题单,滑动窗口的题,感觉掌握了一些滑动窗口的技巧 还投递了一些西安的小企业,如果有机会的话也可以去,毕竟算是实习的经历。 下周工作展望 我想找AI给我的项目提出一些继续改进的项目,让其更有吸引力。比如RAG项目,SFT项目 继续刷灵神题单。不想刷hot100了,因为感觉我的数据结构知识不够系统 ...

面试复盘
面试复盘在这里总结一下面试的流程和自己的问题。 腾讯NLP-大模型算法实习生 自我介绍 1分钟自我介绍简短即可 简单介绍一下项目 感觉介绍的不好,面试官也没怎么听 拷问我的Kaggle竞赛的项目,多少名,leadboard是前%多少,public scores是多少,测试集和训练集分别是什么?你在项目中做了什么?你训练模型的baseline是什么?你用这些模型要达到什么目的? 这个答得很一般,甚至可以说很差,因为我的AIMO确实几乎可以说是没有成绩,就提交了几次,当时是奔着丰富建立取得 拷问RAG项目,项目的目的,项目的任务,项目学到了什么。介绍一下chroma,介绍一下RAG流程 ...

模拟面试
利用AI进行模拟面试将简历发给AI,让AI针对简历和要面试的岗位,提出一些问题,并给出AI的回答,参考AI的回答进行梳理,最终给出自己的回答。 个人科研助手项目RAG的工作流程 文档预处理 文档导入,使用langchain的document_loader方法,导入md文件,PPT文件,PDF文件,word等非结构化文本 文档切块,多少个字符算一个块,块与块之间重合的字符数是多少 使用Embedding模型将chunk向量化,存储入库 检索召回:用户的query作为查询向量,计算查询向量与库中向量的相似度。这里就有一个问题,查询的时候是直接遍历所有文本向量与查询向量的相似度吗?不是的,这样复 ...