大语言模型 | LLM(大语言模型)是一种基于大量文本数据训练的 AI 模型,能够理解和生成自然语言,其参数规模通常范围从数十亿到数百亿。 |
推理服务 | 推理服务是指在机器学习或深度学习领域中,提供高性能、可扩展的预测或推理能力的服务,适用于已训练的模型。 |
推理运行时 | 推理运行时为基于模型的推理服务提供高性能的容器环境,优化资源利用,加速推理过程,并减少延迟。 |
智能体 | 智能体是一个感知其环境、做出决策并自主执行任务的 AI 实体,具有自主性、适应性和目标导向特征。 |
文本生成 | 文本生成指的是使用自然语言处理(NLP)技术基于给定的输入(如上下文、提示或规则)自动生成连贯且有意义的文本内容的过程。 |
文本分类 | 文本分类是将文本数据分配到预先定义的类别或标签的过程,通常通过机器学习或深度学习模型实现,用于信息检索、情感分析和垃圾邮件检测等多种应用中。 |
文本转图像 | 文本转图像是利用 AI 技术,通过将文本描述自动生成图像的过程,将自然语言处理和计算机视觉相结合,将文本转化为视觉内容。 |
虚拟 GPU | 虚拟 GPU(vGPU)是一种利用虚拟化技术将物理 GPU 资源拆分并分配给多个虚拟机的技术,使图形处理能力能够共享和高效利用。 |
物理 GPU | 物理 GPU(pGPU)是指直接将整个物理 GPU 显卡连接到宿主机的虚拟机,以实现对 GPU 资源的独占访问的技术。 |