第(3/3)页 “帆哥,这我室友,也是我们团队的兄弟。” 周进介绍,“陈默,团队负责人,搞架构的。李浩,算法大神。王涛,硬件专家。” 杨帆起身,和三人一一握手。 “坐吧。别拘束。” 四人坐下,周进也挨着杨帆坐下。 陈默作为代表,先开口: “杨哥,周进跟我们说了您的情况。非常感谢您愿意花时间见我们。” 他的声音很稳,但握着文件夹的手指关节有些发白。 “直接说项目吧。”杨帆笑了笑,“我时间有限,你们也时间宝贵。” 陈默点点头,打开文件夹,却没有立刻递过去。 “杨哥,在说具体方案前,我想先问一句——您对AI大语言模型,了解多少?” 这个问题有点冒昧,但杨帆欣赏这种直接。 “了解一些。”他说,“知道GPT、知道国内的豆包,deepSeek。” “知道这东西烧钱,也知道如果做成了,价值巨大。” 陈默眼睛一亮:“那您觉得,我们几个学生,凭什么能做这个?” “凭你们敢做。”杨帆说,“而且,周进相信你们。我信周进。” 这话说得周进心里一暖。 陈默深吸一口气,终于把文件夹推了过来: “这是我们团队的方案。我们做的不是通用大模型——那个确实打不过巨头。” “我们做的是垂直领域的大模型,专门针对代码生成和自动化测试。” 他语速加快,进入专业状态: “现有的代码辅助工具,像COpilOt,是基于通用模型微调的,在特定场景下不够精准。” “我们的模型,从架构设计开始,就是专门为代码场景优化的。” 李浩补充:“我们在学校实验室做了小规模验证。” “在代码补全、错误检测、测试用例生成这三个任务上,我们的模型比同等规模的通用模型,准确率高15%-20%。” 王涛接着说:“硬件方案我们也优化了。” “不需要最顶级的A100/H100,用消费级的5090显卡集群,配合我们的并行计算框架,能达到70%的A100效率,但成本只有三分之一。” 三个人你一言我一语,专业术语不断蹦出来。 第(3/3)页