生活科普

从零复现Llama3代码库爆火大神Kapathy一键三连 GitHub狂揽2k

让大神AndrejKarpathy一键三连❤️，点赞，转发，评论，，一个教你从头开始实现Llama3的代码库爆火，X上转赞收藏量超6.8k，GitHub揽星2k，火就火在，它教你从头用Meta开源的权重进行推理，详细解释和展开了注意力机制中多个头的矩阵乘法、位置编码以及所有中间层，换句话说，他解释了...

2024-11-15 991

生活科普

Emu3 统一多模态输入与生成

Emu3在生成和感知任务中超越了多个任务的专用模型，表现优于主流开源模型如SDXL、LLaVA，1.6和OpenSora，1.2，同时不需要基于Diffison或组合多种不同架构，Emu3能够根据文本输入生成高质量的图像，通过简单地预测下一个视觉标记来实现，该模型自然支持灵活的分辨率和风格，Emu3...

2024-11-15 653

生活科普

多模态视觉

本文回顾了多模态LLM，视觉，语言模型，近一年来的模型架构演进，对其中有代表性的工作进行了精炼总结，截止2024.04，持续更新ing...ASurveyonMultimodalLargeLanguageModels，arxiv.org，abs，2306.13549，Awesome，Multimod...

2024-11-15 631

生活科普

微软发布Florence

近日，微软的AzureAI团队在HuggingFace上发布了一个名为Florence，2的新视觉基础模型，该模型以宽松的MIT许可证可用，可以处理各种视觉和视觉语言任务，使用统一的基于提示的表示形式，它有两个尺寸——232M和771M个参数，并且在字幕生成、目标检测、视觉定位和分割等任务上已经表现...

2024-11-15 580

生活科普

Mol

引言在自然语言处理，NLP，的众多应用场景中，大型语言模型，LargeLanguageModel，LLM，展现了其卓越的文本理解与生成能力，不仅在传统的文本任务上成绩斐然，更在生物学、计算化学、药物研发等跨学科领域证明了其广泛的应用潜力，尽管如此，生物分子研究领域的特殊性—比如专用数据集的缺乏、数据...

2024-11-15 371

生活科普

介绍一款有潜力的标记数据集生成模型如何做大模型指令微调没有标记数据集

在构建大模型应用时，通常有两种方式来改进效果，一种是构建外部知识库，利用RAG来完成，但RAG并不是万能的，对于特定领域的LLM应用，以及无需示例，就能完成特定任务等场合就需要进行微调，然而，微调本身相较于RAG来讲，需要更多的算力资源和时间周期，但更大的瓶颈在于微调需要标记过的样本数据，这对于很多...

2024-11-15 547

生活科普

干货！100多条GPT写论文的经典指令

今日分享100多个常用的论文指令，希望对大家能带来prompt的启发和帮助...确定主题和标题1.举例说明医疗保健的新趋势，这可能是研究论文中有趣的研究主题，2.分析[插入主题名称]的研究是否存在空白，并提出潜在的研究主题，3.使用定量和定性研究方法推荐研究[插入主题名称]的主题，4.分析主题[插入...

2024-11-15 474

生活科普

50个顶级的ChatGPT学术论文指令

我精心整理的50个顶级ChatGPT学术论文指令，无疑是你论文写作和研究中的宝贵财富，强烈推荐你将其收藏！这些指令的实用性非凡，能够显著提升你的研究效率，让论文写作过程不再繁重，翻译晦涩难懂的论文，遇到难以理解的论文，这些指令可以帮你轻松翻译，让复杂的研究内容变得通俗易懂，解读代码和数学公式，代码和...

2024-11-15 190

生活科普

思维可视化提示激发大语言模型空间推理能力

引言最近，大语言模型，LLMs，在各种与语言相关的任务上取得了显著的表现，然而，尽管它们在数学推理、常识推理以及其他推理任务，如符号推理或逻辑推理等方面取得了成功，但它们在空间推理方面的能力仍然未被充分探索，空间推理是人类认知的基本功能，使我们能够与环境互动，它促进了需要理解和推理物体及其运动之间空...

2024-11-15 293

生活科普

解锁大模型的白话EAGLE2 打草稿技术

实时了解业内动态，论文是最好的桥梁，专栏精选论文重点解读热点论文，围绕着行业实践和工程量产，若在某个环节出现卡点，可以回到大模型必备腔调或者LLM背后的基础模型重新阅读，而最新科技，Mamba，xLSTM，KAN，则提供了大模型领域最新技术跟踪，1.总览EAGLE，2EAGLE，2是一种加速...

2024-11-15 693

生活科普

文本直接生成多视角3D图像 Meta推出创新模型

随着扩散模型的不断创新，文生图领域出现了Midjourney、StableDiffusion、DALL，E3等一系列知名产品，但在文本生成多视角3D图像方面一直存在诸多技术难点，Meta和德国慕尼黑工业大学的研究人员联合开发了创新模型——ViewDiff，用户通过文本、图像或二者结合使用，就能生成高...

2024-11-15 487

生活科普

Llama提速500%！谷歌美女程序员手搓矩阵乘法内核

谷歌的美女程序员，将Llama的推理速度提高了500%！近日，天才程序员JustineTunney发推表示自己更新了Llamafile的代码，她重写了84个新的矩阵乘法内核，使得Llamafile可以更快地读取提示和图像，与llama.cpp相比，新的Llamafile在CPU上的推理速度提升了30...

2024-11-15 413

生活科普

自我一致性提升大模型中的思维链推理能力

摘要，结合预训练大型语言模型的链式思考提示在复杂推理任务上已取得令人鼓舞的成果，本文提出了一种新的解码策略——自我一致性，以替代链式思考提示中使用的朴素贪婪解码，该策略首先采样一套多样化的推理路径，而非单一的贪心路径，并通过边缘化采样的推理路径来选择最一致的答案，自我一致性利用了这样一种直觉，一个复...

2024-11-15 993

生活科普

系统的回答质量 Prompt RAG 提升构建高效的

1、Prompt的重要性在RAG，增强检索生成，系统中，打造有效的提示词，Prompt，对于保障大模型输出精准且相关的答案至关重要，提示词不仅负责指导大模型正确解读用户提问，还需整合检索所得的信息，以实现回答的精确性和针对性，接下来，本文将探讨如何在RAG系统中打造高效的提示词，进而提高RAG系统的...

2024-11-15 535

生活科普

09 技术综述 Advanced RAG 提示词压缩

作者，FlorianJune编译，岳扬RAG方法可能会面临两大挑战，为了解决上述问题，LLM的提示词压缩技术，Promptcompression，应运而生，从本质上讲，其目的是精炼提示词中的关键信息，使得每个输入的词元，inputtokens，都承载更多价值，从而提升模型效率并还能控制成本，这一理念...

2024-11-15 396

生活科普

联系我们