名称描述
大语言模型LLM(大语言模型)是一种基于大量文本数据训练的 AI 模型,能够理解和生成自然语言,其参数规模通常范围从数十亿到数百亿。
推理服务推理服务是指在机器学习或深度学习领域中,提供高性能、可扩展的预测或推理能力的服务,适用于已训练的模型。
推理运行时推理运行时为基于模型的推理服务提供高性能的容器环境,优化资源利用,加速推理过程,并减少延迟。
智能体智能体是一个感知其环境、做出决策并自主执行任务的 AI 实体,具有自主性、适应性和目标导向特征。
文本生成文本生成指的是使用自然语言处理(NLP)技术基于给定的输入(如上下文、提示或规则)自动生成连贯且有意义的文本内容的过程。
文本分类文本分类是将文本数据分配到预先定义的类别或标签的过程,通常通过机器学习或深度学习模型实现,用于信息检索、情感分析和垃圾邮件检测等多种应用中。
文本转图像文本转图像是利用 AI 技术,通过将文本描述自动生成图像的过程,将自然语言处理和计算机视觉相结合,将文本转化为视觉内容。
虚拟 GPU虚拟 GPU(vGPU)是一种利用虚拟化技术将物理 GPU 资源拆分并分配给多个虚拟机的技术,使图形处理能力能够共享和高效利用。
物理 GPU物理 GPU(pGPU)是指直接将整个物理 GPU 显卡连接到宿主机的虚拟机,以实现对 GPU 资源的独占访问的技术。