寻找准确度得分至少为 3 的模型。如果得分低于 3,请寻找其他选项或仔细检查准确度细分。您可以在准确度方法的自动和手动模式之间切换;手动更可靠。
从精确的模型列表中,审查成本以回报率。
有些用例需要快速响应,因此请寻找适合您速度需求的模型。
评估您用例的信任度和安全性。您的行业可能在这方面更为敏感。您还可以考虑使用 salesforce 虚拟私有云上的 llm,以获得更高的安全性。
在我们与客户合作进行
基准测试时,他们一致表示需要估算 ai 用例的未来投资回报率。为此,他们会寻找准确度得分高于 3 的模型,但成本也要低得多。例如,如果您每季度需要汇总 50 万个客户电话,那么模型之间 50 倍的成本差异可能会毁掉您的投资回报率和业务案例。基准测试工具会指导您找到正 手机号码数据 确的用例和正确的 llm,以满足您对成本、准确性、速度和信任的个人需求。
通过遵循这六个步骤,您可以确定用例并选择一个模型(或多个模型)来满足您的需求。现在,您已准备好在 agentforce 中快速配置用例,或启动更复杂的 diy 项目。
为 crm 创建第一个 llm 基准
了解有关基准测试的独特指标和方法的技术细节的更多信息。
仔细观察当您确定
生成式 ai 用例的优先级时,此仪表板可以为您节省数 博目录 数月的探索和用户验收测试时间。它可以帮助您确定正确的用例和具有多种功能的 llm。它还可以避免因 ai 采用率低而带来的负面体验。
客户插图
让我们看一下最近参与基准测试的客户的用例。他们从一个低风险、高价值的用例开始:呼叫摘要(请参阅基准测试中的服务:呼叫摘要 ii)。他们进行了手动评估,其中主题专家对所有模型进行了评分(使用服务代理和客户之间对话的真实数据)。大多数模型都具有良好的准确性;但是,只有一个模型也是低成本的:mistral nemo。凭借这种洞察力以及自动评估的类似结果,客户以高精度验 采用生成式人工智能的比 证了用例,甚至在几个小时内找到了证明投资回报率的最佳模型。