五月婷婷丁香性爱|j久久一级免费片|久久美女福利视频|中文观看在线观看|加勒比四区三区二|亚洲裸女视频网站|超碰97AV在线69网站免费观看|有码在线免费视频|久久青青日本视频|亚洲国产AAAA

[快速入門]免費ai模型
ModelArts Studio大模型開發(fā)平臺

豐富多樣的AI訓(xùn)練數(shù)據(jù)集 場景化AI案例,助力AI賦能千行百業(yè) 查看全部 學(xué)習(xí)資源 學(xué)習(xí)資源 AI開發(fā)基本流程介紹 自動學(xué)習(xí)簡介 使用預(yù)置算法構(gòu)建模型 使用自定義算法構(gòu)建模型 查看全部 即刻領(lǐng)取 免費試用 產(chǎn)品 開啟您的大模型之旅 企業(yè)免費試用 您可能感興趣的產(chǎn)品 您可能感興趣的產(chǎn)品 盤古大模型

盤古預(yù)測大模型

文檔與學(xué)習(xí)成長 盤古大模型 盤古大模型 什么是盤古大模型 盤古預(yù)測大模型能力與規(guī)格 盤古大模型快速入門 如何調(diào)用盤古大模型API 查看全部 AI Gallery百模千態(tài)社區(qū) AI Gallery百模千態(tài)社區(qū) 優(yōu)質(zhì)昇騰云AI模型專區(qū) 幾行代碼自由部署AI應(yīng)用 豐富多樣的AI訓(xùn)練數(shù)據(jù)集 場景化AI案例,助力AI賦能千行百業(yè)

Web應(yīng)用防火墻WAF-大模型防火墻

全新上線:大模型防火墻 全新上線:大模型防火墻 全面守護AI應(yīng)用安全,防范提示詞攻擊,確保內(nèi)容合規(guī)與數(shù)據(jù)隱私 全面守護AI應(yīng)用安全,防范提示詞攻擊,確保內(nèi)容合規(guī)與數(shù)據(jù)隱私 免費試用大模型防火墻公測上線,可申請免費試用一個月 申請公測 了解更多 提示詞攻擊防護 識別并攔截惡意提示詞,防止大模型被誘導(dǎo)生成不當(dāng)內(nèi)容。

華為云會議免費下載

華為云會議,更專業(yè)“會”更好 華為云會議,更專業(yè)“會”更好 注冊免費送50方云會議室,支持最多50人同時入會 注冊免費送50方云會議室,支持最多50人同時入會 購買咨詢 免費體驗 產(chǎn)品優(yōu)勢 高清視頻會議 4K超高清數(shù)據(jù)共享,1080p高清視頻,首家移動端720p,端到端時延<200ms,高清流暢

華為云會議免費下載

華為云會議,更專業(yè)“會”更好 注冊免費送50方云會議室,支持最多50人同時入會 免費領(lǐng)取 套餐訂購咨詢 云會議 手機/Windows/macOS多端接入,隨時隨地入會 網(wǎng)絡(luò)研討會 會議+直播融合體驗,3000人實時在線互動 智能會議室 提供全系列會議硬件終端,軟硬一體智能會議體驗 API&SDK

盤古NLP大模型

優(yōu)質(zhì)昇騰云AI模型專區(qū) 幾行代碼自由部署AI應(yīng)用 豐富多樣的AI訓(xùn)練數(shù)據(jù)集 場景化AI案例,助力AI賦能千行百業(yè) 查看全部 學(xué)習(xí)資源 學(xué)習(xí)資源 AI開發(fā)基本流程介紹 自動學(xué)習(xí)簡介 使用預(yù)置算法構(gòu)建模型 使用自定義算法構(gòu)建模型 查看全部 即刻領(lǐng)取 免費試用 產(chǎn)品 開啟您的大模型之旅 企業(yè)免費試用

CodeArts活動頁

內(nèi)全量構(gòu)建的極速構(gòu)建、支持億級測試用例資產(chǎn)復(fù)用、千萬級壓測先進能力。 更智能: CodeArts引用大模型AIGC的突破,已實現(xiàn)代碼智能生成、測試文本用例智能生成等,后續(xù)CodeArts會不斷創(chuàng)新探索,將AI技術(shù)貫穿軟件開發(fā)生命周期始終。 更安全: CodeArts致力從運行態(tài)的

華為云WeLink飛羽審批

業(yè)務(wù)套件 分權(quán)分域管理 基礎(chǔ)智能語音助手 審批模型數(shù) 50 個 限時免費,更多權(quán)益 標(biāo)準(zhǔn)版本 基礎(chǔ)版本的一切功能 審批模型數(shù) 100 個 分支條件數(shù)量 50 個 發(fā)票識別 選項關(guān)聯(lián) 電子簽署 立即購買 個性定制,高階服務(wù) 旗艦版本 標(biāo)準(zhǔn)版本的一切功能 審批模型數(shù) 1000 個 分支條件數(shù)量

ModelBox開發(fā)者專區(qū)

開源鏡像開發(fā) ModelBox AI應(yīng)用開發(fā) ModelBox是一套專門為AI開發(fā)者提供的易于使用,高效,高擴展的AI推理開發(fā)框架,它可以幫助AI開發(fā)者快速完成從模型文件到AI推理應(yīng)用的開發(fā)和上線工作,降低AI算法落地門檻,同時帶來AI應(yīng)用的高穩(wěn)定性和極致性能。 基于ModelBox開源社區(qū)源碼開發(fā)AI應(yīng)用

[相關(guān)產(chǎn)品]免費ai模型
智慧監(jiān)控AI模型

智慧監(jiān)控AI模型綜合集成了人臉識別模型、安全帽識別模型、口罩佩戴識別模型、車牌識別模型、車輛占道識別模型5種AI模型。一,人臉識別服務(wù) 人臉識別模型目前提供授權(quán)認(rèn)證、模型加載、人臉注冊、人臉識別、人臉刪除、特征提取六個接口服務(wù)。 授權(quán)認(rèn)證:需先進行授權(quán)認(rèn)證,才能夠正常使用人臉識別服務(wù);

AI大模型 算法備案

《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》明確,具有輿論屬性或者社會動員能力的算法推薦服務(wù)提供者應(yīng)當(dāng)在提供服務(wù)之日起十個工作日內(nèi)通過互聯(lián)網(wǎng)信息服務(wù)算法備案系統(tǒng)填報服務(wù)提供者的名稱、服務(wù)形式、應(yīng)用領(lǐng)域、算法類型、算法自評估報告、擬公示內(nèi)容等信息  方便

AI大模型專業(yè)服務(wù)

湘江鯤鵬目前在人工智能模型領(lǐng)域擁有算力、數(shù)據(jù)、算法三大關(guān)鍵要素的經(jīng)驗積累,構(gòu)建了大模型三個方面的差異化競爭力,盤古大模型AI專業(yè)服務(wù)覆蓋從前期咨詢、規(guī)劃設(shè)計,到數(shù)據(jù)工程、模型訓(xùn)練,再到應(yīng)用工程及模型運維的完整流程?;谌A為盤古提供的AI專業(yè)服務(wù)包,致力于為企業(yè)提供一站式人工智能解決方案

企業(yè)級AI模型開發(fā)

云塢網(wǎng)絡(luò)專注于利用先進的AI云計算、大數(shù)據(jù)和人工智能技術(shù),為企業(yè)提供卓越的ChatGPT行業(yè)解決方案。幫助企業(yè)快速實現(xiàn)數(shù)字化、智能化和綠色化轉(zhuǎn)型。 系統(tǒng)定制開發(fā):我們可以為客戶提供系統(tǒng)的定制開發(fā)服務(wù),幫助客戶實現(xiàn)更多的個性化功能和業(yè)務(wù)流程需求。,數(shù)據(jù)遷移:我們幫助客戶將現(xiàn)有系統(tǒng)的

大模型及AI應(yīng)用配套服務(wù)

angChain等流行的大模型開發(fā)框架,構(gòu)建企業(yè)級AI應(yīng)用;團隊擁有成熟的軟件工程技術(shù)和管理能力。6. 大模型使用的技術(shù)支持,用戶使用大模型平臺,解答用戶使用過程遇到的問題;大模型與應(yīng)用對接集成,以及進行日常巡檢、故障處理、模型升級等服務(wù)。4. 工業(yè)數(shù)據(jù)模型(CAD模型、CAE模

天尊大模型AIGC場景解決方案

太杉天尊大模型AIGC場景解決方案是以AI場景解決方案為核心的全棧Maas綜合方案,助力政企客戶靈活部署(可公有可私有部署)。具備自研的行業(yè)模型能力,主要用于政府/公安/教育等行業(yè)的數(shù)據(jù)處理、文本處理以及多模態(tài)處理等多場景。太杉天尊大模型AIGC場景解決方案,是一款專為滿足政府企

人工智能AI大模型技術(shù)研發(fā)定制服務(wù)

公司集成了世界領(lǐng)先的底層大模型,具備打通跨模型和工具鏈的平臺,提供從需求分析、數(shù)據(jù)收集、模型設(shè)計、訓(xùn)練優(yōu)化、評估、系統(tǒng)集成、用戶界面設(shè)計、部署維護、合規(guī)性檢查、技術(shù)支持、性能監(jiān)控、擴展性設(shè)計、定制服務(wù)到持續(xù)研發(fā)一站式AI模型定制研發(fā)服務(wù)。光啟慧語是一家圍繞大模型全棧開展技術(shù)研發(fā)和產(chǎn)品

博匠行業(yè)AI大模型專業(yè)服務(wù)

數(shù)據(jù)質(zhì)量。4. 模型訓(xùn)練:?設(shè)計調(diào)優(yōu)方案,實施模型訓(xùn)練,并進行模型評測。?熟悉盤古大模型工作流和云服務(wù)操作,確保模型效果優(yōu)化。5. 應(yīng)用工程:?提供基于大模型能力的Agent開發(fā)和應(yīng)用對接服務(wù)。?具備良好的軟件開發(fā)和溝通能力,實現(xiàn)大模型與應(yīng)用的無縫對接。6. 模型運維: ?提供技

天尊大模型AIGC場景解決方案配套服務(wù)

天尊大模型AIGC場景解決方案配套服務(wù)是太杉AIGC解決方案的人工服務(wù),是以AI應(yīng)用解決方案為核心的全棧Maas綜合方案,助力政企客戶靈活部署(可公有可私有部署)。主要用于政府/公安/教育等行業(yè)的數(shù)據(jù)處理、文本處理以及多模態(tài)處理等多場景。天尊大模型AIGC場景解決方案配套服務(wù)是太

[相似文章]免費ai模型
華為云盤古大模型_華為云AI大模型_盤古人工智能

了解詳情 盤古預(yù)測大模型 盤古預(yù)測大模型是面向結(jié)構(gòu)化類數(shù)據(jù),基于10類2000個基模型空間,通過模型推薦、融合兩步優(yōu)化策略,構(gòu)建圖網(wǎng)絡(luò)架構(gòu)AI模型。 了解詳情 盤古科學(xué)計算大模型 科學(xué)計算大模型是面向氣象、醫(yī)藥、水務(wù)、機械、航天航空等領(lǐng)域,采用AI數(shù)據(jù)建模和AI方程求解的方法;從海

免費AI客服電話_AI智能語音外呼系統(tǒng)_AI人工語音智能電話

3,000.00元/年 免費AI客服電話-智能AI客戶聯(lián)絡(luò)中心-AI智能電話機器特征 免費AI客服電話-智能AI客戶聯(lián)絡(luò)中心-AI智能電話機器特征 免費AI客服電話-內(nèi)置ASR引擎 支持ASR,NLP,NLU,TTS等技術(shù)數(shù)據(jù)整合識別、響應(yīng)飛速提升 免費AI客服電話-多輪會話 領(lǐng)先

ModelArts推理部署_模型_AI應(yīng)用來源-華為云

ModelArts支持本地準(zhǔn)備模型包,編寫模型配置文件和模型推理代碼,將準(zhǔn)備好的模型包上傳至對象存儲服務(wù)OBS,從OBS導(dǎo)入模型創(chuàng)建為AI應(yīng)用。 制作模型包,則需要符合一定的模型包規(guī)范。模型包里面必需包含“model”文件夾,“model”文件夾下面放置模型文件,模型配置文件,模型推理代碼文件。

ModelArts模型訓(xùn)練_模型訓(xùn)練簡介_如何訓(xùn)練模型

ModelArts模型訓(xùn)練 ModelArts模型訓(xùn)練簡介 ModelArts模型訓(xùn)練,俗稱“建模”,指通過分析手段、方法和技巧對準(zhǔn)備好的數(shù)據(jù)進行探索分析,從中發(fā)現(xiàn)因果關(guān)系、內(nèi)部聯(lián)系和業(yè)務(wù)規(guī)律,為商業(yè)目的提供決策參考。訓(xùn)練模型的結(jié)果通常是一個或多個機器學(xué)習(xí)或深度學(xué)習(xí)模型模型可以應(yīng)用到新的數(shù)據(jù)中,得到預(yù)測、評價等結(jié)果。

免費的企業(yè)用郵箱_mail企業(yè)郵箱_免費注冊企業(yè)郵箱

選擇企業(yè)郵箱。 企業(yè)郵箱購買計費 華為云有免費企業(yè)郵箱嗎 您可以多關(guān)注和華為云企業(yè)郵箱相關(guān)的活動,當(dāng)前可以免費試用15天,在15天內(nèi)相當(dāng)于免費企業(yè)郵箱。 注冊企業(yè)郵箱收費嗎 注冊企業(yè)郵箱一般是需要收費的,但各個廠商有活動時,可能有可以免費試用的活動。您可以關(guān)注華為云的企業(yè)郵箱活動。

GaussDB數(shù)據(jù)庫模型_GaussDB是什么_高斯數(shù)據(jù)庫模型

華為數(shù)據(jù)庫GaussDB_GaussDB數(shù)據(jù)庫的優(yōu)點_【免費】_GaussDB分布式數(shù)據(jù)庫_數(shù)據(jù)庫平臺 關(guān)系數(shù)據(jù)庫管理系統(tǒng)_數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)庫應(yīng)用 數(shù)據(jù)庫軟件免費版 云數(shù)據(jù)庫免費_云數(shù)據(jù)庫免費試用 免費數(shù)據(jù)庫GaussDB NoSQL_云數(shù)據(jù)庫_數(shù)據(jù)庫免費免費云數(shù)據(jù)庫 MySQL數(shù)據(jù)庫入門 云數(shù)據(jù)庫和普通數(shù)據(jù)庫

登錄企業(yè)用郵箱_mail企業(yè)郵箱_免費企業(yè)郵箱

域名1元起,免費云解析 郵箱免費試用 0元體驗旗艦版的產(chǎn)品 企業(yè)郵箱購買計費 華為云企業(yè)郵箱有折扣活動嗎 您可以多關(guān)注和華為云企業(yè)郵箱相關(guān)的活動,當(dāng)前華為云企業(yè)郵箱可以享受最低5折優(yōu)惠。 注冊企業(yè)郵箱收費嗎 注冊企業(yè)郵箱一般是需要收費的,但各個廠商有活動時,可能有可以免費試用的活動。您可以關(guān)注華為云的企業(yè)郵箱活動。

.email域名注冊_如何注冊.email域名

.email域名注冊 什么是.email域名注冊? 域名注冊(Domain Registration)是用戶付費獲取Internet上某一域名一段時間使用權(quán)的過程。華為云域名注冊服務(wù)提供域名的注冊、購買、實名認(rèn)證以及管理功能。 華為云的域名注冊服務(wù)與新網(wǎng)合作,因此通過華為云注冊的

DeepSeek-R1蒸餾模型部署及體驗

這些DeepSeek模型在多項能力上與OpenAI的o1-mini相當(dāng),為開發(fā)者提供了強大的AI能力。 在MaaS平臺上,DeepSeek-R1蒸餾模型已經(jīng)部署上線,開發(fā)者可以通過在線體驗或API調(diào)用來使用這些模型。為了幫助開發(fā)者快速驗證和開發(fā)創(chuàng)新的AI應(yīng)用,平臺還提供了200

免費ai模型

ModelArts Studio大模型即服務(wù)平臺部署成功的模型服務(wù)支持在其他業(yè)務(wù)環(huán)境中調(diào)用。本文以我的服務(wù)為例,調(diào)用部署的模型服務(wù)。您也可以調(diào)用預(yù)置服務(wù)-免費服務(wù)、預(yù)置服務(wù)-商用服務(wù)或自定義接入點。

操作場景

在企業(yè)AI應(yīng)用開發(fā)過程中,開發(fā)人員通常需要將訓(xùn)練好的模型部署到實際業(yè)務(wù)環(huán)境中。然而,傳統(tǒng)方法需要手動配置環(huán)境、處理依賴關(guān)系、編寫部署腳本,整個過程耗時且容易出錯,且存在環(huán)境復(fù)雜、遷移困難、維護成本高、版本更新麻煩等問題。

ModelArts Studio(MaaS)大模型即服務(wù)平臺提供了一站式解決方案,提供統(tǒng)一的API接口方便業(yè)務(wù)系統(tǒng)調(diào)用,并提供監(jiān)控和日志功能便于運維管理。

計費說明

在調(diào)用模型推理服務(wù)的過程中,輸入內(nèi)容首先會被分詞(tokenize),轉(zhuǎn)換為模型可識別的Token。在調(diào)用MaaS預(yù)置服務(wù)時,將根據(jù)實際使用的Tokens數(shù)量進行計費。計費詳情請參見計費說明。

約束限制

對于支持圖片上傳的模型,單個圖片文件的大小不超過10MB。如果以Base64編碼形式上傳圖片,需確保編碼后的圖片小于10MB。

前提條件

步驟一:獲取API Key

在調(diào)用MaaS部署的模型服務(wù)時,需要填寫API Key用于接口的鑒權(quán)認(rèn)證。最多可創(chuàng)建30個密鑰。每個密鑰僅在創(chuàng)建時顯示一次,請確保妥善保存。如果密鑰丟失,無法找回,需要重新創(chuàng)建API Key以獲取新的訪問密鑰。更多信息,請參見在ModelArts Studio(MaaS)管理API Key。

  1. 登錄ModelArts Studio(MaaS)控制臺,在頂部導(dǎo)航欄選擇目標(biāo)區(qū)域。
  2. 在左側(cè)導(dǎo)航欄,單擊“API Key管理”。
  3. “API Key管理”頁面,單擊“創(chuàng)建API Key”,填寫標(biāo)簽和描述信息后,單擊“確定”

    標(biāo)簽和描述信息在創(chuàng)建完成后,不支持修改。

    表1 創(chuàng)建API Key參數(shù)說明

    參數(shù)

    說明

    標(biāo)簽

    自定義API Key的標(biāo)簽。標(biāo)簽具有唯一性,不可重復(fù)。僅支持大小寫英文字母、數(shù)字、下劃線、中劃線,長度范圍為1~100個字符。

    描述

    自定義API Key的描述,長度范圍為1~100個字符。

  4. “您的密鑰”對話框,復(fù)制密鑰并保存至安全位置。
  5. 保存完畢后,單擊“關(guān)閉”。

    單擊“關(guān)閉”后將無法再次查看密鑰。

步驟二:調(diào)用MaaS模型服務(wù)進行預(yù)測

  1. ModelArts Studio(MaaS)控制臺左側(cè)導(dǎo)航欄,選擇“在線推理”。
  2. “在線推理”頁面,單擊“我的服務(wù)”頁簽,在目標(biāo)服務(wù)右側(cè),單擊操作列的“更多 > 調(diào)用說明”
  3. “關(guān)閉 內(nèi)容審核 服務(wù)”對話框,選擇是否啟用內(nèi)容審核(默認(rèn)啟用)。
    • 啟用內(nèi)容審核,可以阻止在線推理中的輸入輸出中出現(xiàn)不合規(guī)的內(nèi)容,但可能會對接口性能產(chǎn)生較大影響。
    • 關(guān)閉內(nèi)容審核服務(wù),將不會審核在線推理中的輸入輸出,模型服務(wù)可能會有違規(guī)風(fēng)險,請謹(jǐn)慎關(guān)閉。

      關(guān)閉“內(nèi)容審核”開關(guān),需要在彈窗中確認(rèn)是否停用內(nèi)容審核服務(wù),勾選“我已閱讀并同意上述說明”后,單擊“確定”關(guān)閉。

  4. “調(diào)用說明”頁面,選擇接口類型,復(fù)制調(diào)用示例,修改接口信息和API Key后用于業(yè)務(wù)環(huán)境調(diào)用模型服務(wù)API。

    Rest API、OpenAI SDK的示例代碼如下。

    • Rest API示例代碼如下所示:
      • 使用Python調(diào)用示例。
        import requests
        import json
        
        if __name__ == '__main__':
            url = "https:/example.com/v1/infers/937cabe5-d673-47f1-9e7c-2b4de06*****/v1/chat/completions"
            api_key = "<your_apiKey>"  # 把<your_apiKey>替換成已獲取的API Key。
        
            # Send request.
            headers = {
                'Content-Type': 'application/json',
                'Authorization': f'Bearer {api_key}'
            }
            data = {
                "model": "******",  # 調(diào)用時的模型名稱。
                "max_tokens": 1024,  # 最大輸出token數(shù)。
                "messages": [
                    {"role": "system", "content": "You are a helpful assistant."},
                    {"role": "user", "content": "hello"}
                ],
                # 是否開啟流式推理,默認(rèn)為False,表示不開啟流式推理。
                "stream": False,
                # 在流式輸出時是否展示使用的token數(shù)目。只有當(dāng)stream為True時該參數(shù)才會生效。
                # "stream_options": {"include_usage": True},
                # 控制采樣隨機性的浮點數(shù),值較低時模型更具確定性,值較高時模型更具創(chuàng)造性。"0"表示貪婪取樣。默認(rèn)為0.6。
                "temperature": 0.6
            }
        	response = requests.post(url, headers=headers, data=json.dumps(data), verify=False)
        	# Print result.     
        	print(response.status_code)     
        	print(response.text)
      • 使用cURL調(diào)用示例。
        curl -X POST "https://example.com/v1/chat/completions" \
          -H "Content-Type: application/json" \
          -H "Authorization: Bearer $API_KEY" \
          -d '{ 
            "model": "DeepSeek-R1",
            "messages": [
              {"role": "system", "content": "You are a helpful assistant."},
              {"role": "user", "content": "你好"}
            ],
            "stream": true,
            "stream_options": { "include_usage": true },
            "temperature": 0.6
          }'
    • 使用OpenAI SDK調(diào)用示例。
      # 安裝環(huán)境命令。
      pip install --upgrade "openai>=1.0"
      # OpenAI SDK調(diào)用示例。
      from openai import OpenAI
      
      if __name__ == '__main__':
      	base_url = "https://example.com/v1/infers/937cabe5-d673-47f1-9e7c-2b4de06******/v1"
      	api_key = "<your_apiKey>"  # 把<your_apiKey>替換成已獲取的API Key。
      
      	client = OpenAI(api_key=api_key, base_url=base_url)
      
      	response = client.chat.completions.create(
      		model="******",
      		messages=[
      			{"role": "system", "content": "You are a helpful assistant"},
      			{"role": "user", "content": "Hello"},
      		],
      		max_tokens=1024,
      		temperature=0.6,
      		stream=False
      	)
      	# Print result.     
              print(response.choices[0].message.content)

    模型服務(wù)的API與vLLM相同,表2僅介紹關(guān)鍵參數(shù),詳細(xì)參數(shù)解釋請參見vLLM官網(wǎng)。使用昇騰云909鏡像的模型,開啟流式輸出時,需要新增stream_options參數(shù),值為{"include_usage":true},才會打印token數(shù)。

    表2 請求參數(shù)說明

    參數(shù)

    是否必選

    默認(rèn)值

    參數(shù)類型

    描述

    url

    Str

    調(diào)用時的API地址。假設(shè)URL為https://example.com/v1/infers/937cabe5-d673-47f1-9e7c-2b4de06*****/{endpoint} , 其中{endpoint}僅支持如下接口,詳細(xì)介紹請參見接口調(diào)用說明。

    • /v1/chat/completions
    • /v1/models

    model

    Str

    調(diào)用時的模型名稱。

    在ModelArts Studio大模型即服務(wù)平臺的“在線推理”頁面,選擇調(diào)用的模型服務(wù),單擊操作列的“更多 > 調(diào)用”,在調(diào)用頁面可以獲取“模型名稱”。

    messages

    -

    Array

    請求輸入的問題。

    messages.role

    Str

    不同的role對應(yīng)不同的消息類型。

    • system:開發(fā)人員輸入的指令,例如模型應(yīng)遵循的答復(fù)格式、扮演的角色等。
    • user:用戶輸入的消息,包括提示詞和上下文信息。
    • assistant:模型生成的回復(fù)內(nèi)容。
    • tool:模型調(diào)用工具返回的信息。

    messages.content

    Str

    • 當(dāng)role為system時:給AI模型設(shè)定的人設(shè)。
      {"role": "system","content": "你是一個樂于助人的AI助手"}
    • 當(dāng)role為user時:用戶輸入的問題。
      {"role": "user","content": "9.11和9.8哪個大?"}
    • 當(dāng)role為assistant時:AI模型輸出的答復(fù)內(nèi)容。
      {"role": "assistant","content": "9.11大于9.8"}
    • 當(dāng)role為tool時:AI模型調(diào)用的工具響應(yīng)信息。
      {"role": "tool", "content": "上海今天天氣晴,氣溫10度"}

    stream_options

    Object

    該參數(shù)用于配置在流式輸出時是否展示使用的token數(shù)目。只有當(dāng)stream為True的時候該參數(shù)才會激活生效。如果您需要統(tǒng)計流式輸出模式下的token數(shù)目,可將該參數(shù)配置為stream_options={"include_usage":True}。

    max_tokens

    16

    Int

    當(dāng)前任務(wù)允許的生成Token數(shù)上限,包括模型輸出的Tokens和深度思考的Reasoning Tokens。

    top_k

    -1

    Int

    在生成過程中,候選集大小限定了采樣的范圍。以取值50為例,這意味著每一步僅會考慮得分排在前50位的Token構(gòu)成候選集進行隨機抽樣。增大此值將提高輸出的隨機性,減小此值會增強輸出的確定性。

    top_p

    1.0

    Float

    模型核采樣(nucleus sampling)。僅保留累計概率剛好超過閾值p的那一部分詞,其余全部屏蔽,最后在這份候選詞里重新歸一化并采樣。

    設(shè)置值越小,候選詞越少,模型輸出越集中和保守;設(shè)置值越大,候選詞越多,模型輸出越開放和多樣。

    通常情況只建議調(diào)整temperature或top_p,不要同時修改兩個參數(shù)。

    取值范圍:0~1,設(shè)置為“1”表示考慮所有Tokens。

    temperature

    0.6

    Float

    模型采樣溫度。設(shè)置的值越高,模型輸出越隨機;設(shè)置的值越低,輸出越確定。

    通常情況只建議調(diào)整temperature或top_p,不要同時修改兩個參數(shù)。

    temperature取值建議:DeepSeek-R1、DeepSeek-V3、Qwen3系列建議值為0.6,Qwen2.5-VL系列建議值為0.2。

    stop

    None

    None/Str/List

    用于停止生成的字符串列表。返回的輸出將不包含停止字符串。

    例如,設(shè)置為["你","好"]時,在生成文本過程中,遇到“你”或者“好”將停止文本生成。

    stream

    False

    Bool

    是否開啟流式推理。默認(rèn)為False,表示不開啟流式推理。

    n

    1

    Int

    為每個輸入的消息生成的響應(yīng)數(shù)。

    • 不使用beam_search場景下,n取值建議為1≤n≤10。如果n>1時,必須確保不使用greedy_sample采樣,也就是top_k > 1,temperature > 0。
    • 使用beam_search場景下,n取值建議為1<n≤10。如果n=1,會導(dǎo)致推理請求失敗。
    說明:

    n建議取值不超過10,n值過大會導(dǎo)致性能劣化,顯存不足時,推理請求會失敗。

    use_beam_search

    False

    Bool

    是否使用beam_search替換采樣。

    使用該參數(shù)時,如下參數(shù)必須按要求設(shè)置。

    • n:大于1
    • top_p:1.0
    • top_k:-1
    • temperature:0.0

    presence_penalty

    0.0

    Float

    presence_penalty表示會根據(jù)當(dāng)前生成的文本中新出現(xiàn)的詞語進行獎懲。取值范圍[-2.0,2.0]。

    frequency_penalty

    0.0

    Float

    frequency_penalty會根據(jù)當(dāng)前生成的文本中各個詞語的出現(xiàn)頻率進行獎懲。取值范圍[-2.0,2.0]。

    length_penalty

    1.0

    Float

    length_penalty表示在beam search過程中,對于較長的序列,模型會給予較大的懲罰。

    使用該參數(shù)時,必須添加如下三個參數(shù),且必須按要求設(shè)置。

    • top_k:-1
    • use_beam_search:true
    • best_of:大于1
    • 普通requests包、OpenAI SDK、curl命令的返回示例如下所示:
      {
          "id": "cmpl-29f7a172056541449eb1f9d31c*****",
          "object": "chat.completion",
          "created": 17231*****,
          "model": "******",
          "choices": [
              {
                  "index": 0,
                  "message": {
                      "role": "assistant",
                      "content": "你好!很高興能為你提供幫助。有什么問題我可以回答或幫你解決嗎?"
                  },
                  "logprobs": null,
                  "finish_reason": "stop",
                  "stop_reason": null
              }
          ],
          "usage": {
              "prompt_tokens": 20,
              "total_tokens": 38,
              "completion_tokens": 18
          }
      }
    • 思維鏈模型的返回示例如下所示:
      messages = [{"role": "user", "content": "9.11 and 9.8, which is greater?"}]
      response = client.chat.completions.create(model=model, messages=messages)
      reasoning_content = response.choices[0].message.reasoning_content
      content = response.choices[0].message.content
      print("reasoning_content:", reasoning_content)
      print("content:", content)
    表3 返回參數(shù)說明

    參數(shù)

    參數(shù)類型

    描述

    id

    Str

    請求ID。

    object

    Str

    請求任務(wù)。

    created

    Int

    請求生成的時間戳。

    model

    Str

    調(diào)用的模型名。

    choices

    Array

    模型生成內(nèi)容。

    usage

    Object

    請求輸入長度、輸出長度和總長度。

    • prompt_tokens:輸入Tokens數(shù)。
    • completion_tokens:輸出Tokens數(shù)。
    • total_tokens:總Tokens數(shù)。

    總Tokens數(shù) = 輸入Tokens數(shù) + 輸出Tokens數(shù)

    reasoning_content

    Str

    當(dāng)模型支持思維鏈時,模型的思考內(nèi)容。對于支持思維鏈的模型,開啟流式輸出時,會首先在reasoning_content字段輸出思考內(nèi)容,然后在content中輸出回答內(nèi)容。

    content

    Str

    模型的回答內(nèi)容。

    當(dāng)調(diào)用失敗時,可以根據(jù)錯誤碼調(diào)整腳本或運行環(huán)境。
    表4 常見錯誤碼

    錯誤碼

    錯誤內(nèi)容

    說明

    400

    Bad Request

    請求包含語法錯誤。

    403

    Forbidden

    服務(wù)器拒絕執(zhí)行。

    404

    Not Found

    服務(wù)器找不到請求的網(wǎng)頁。

    500

    Internal Server Error

    服務(wù)內(nèi)部錯誤。

內(nèi)容審核說明

  • 流式請求
    • 如果觸發(fā)內(nèi)容審核,則會返回錯誤:錯誤碼403。您可以通過錯誤碼ModelArts.81011來判斷。返回內(nèi)容如下:
      {
          "error_code": "ModelArts.81011",
          "error_msg": "May contain sensitive information, please try again."
      }
      圖1 報錯示例
    • 如果未觸發(fā)內(nèi)容審核,則使用postman調(diào)用返回參考如下,返回碼200。
      圖2 正常返回示例
    • 如果輸出有敏感信息,則會在輸出流后面拼接如下數(shù)據(jù):
      data: {"id":"chatcmpl-*********************","object":"chat.completion","created":1678067605,"model":"******","choices":[{"delta":{"content":"這是流式響應(yīng)的開始。"},"index":0}]
      data: {"id":"chatcmpl-*********************","object":"chat.completion","created":1678067605,"model":"******","choices":[{"delta":{"content":" 繼續(xù)輸出結(jié)果。"},"index":0}]
      data: {"id":"chatcmpl-*********************","object":"chat.completion","created":1678067605,"model":"******","choices":[{"finish_reason":"content_filter","index":0}]}
      data: [DONE]

      觸發(fā)內(nèi)容審核之后,"finish_reason"是"content_filter";正常的流式停止是 "finish_reason":"stop"。

  • 非流式請求
    • 如果觸發(fā)內(nèi)容審核,則會返回錯誤:錯誤碼403。您可以通過錯誤碼ModelArts.81011來判斷。

      返回內(nèi)容如下:

      {
          "error_code": "ModelArts.81011",
          "error_msg": "May contain sensitive information, please try again."
      }
      
    • 如果未觸發(fā),則正常返回,示例如下:
      圖3 正常返回示例

接口調(diào)用說明

假設(shè)API地址為https://example.com/v1/infers/937cabe5-d673-47f1-9e7c-2b4de06*****/{endpoint} ,其中{endpoint}僅支持如下接口:

  • /v1/chat/completions
  • /v1/models

注意:

  • /v1/models使用GET方法不需要請求體,而/v1/chat/completions需要POST請求方式和對應(yīng)的JSON請求體。
  • 通用請求頭為Authorization: Bearer YOUR_API_KEY,對于POST請求,還需包含Content-Type: application/json。
表5 接口說明

類型/接口

/v1/models

/v1/chat/completions

請求方法

GET

POST

用途

獲取當(dāng)前支持的模型列表。

用于聊天對話型生成調(diào)用。

請求體說明

無需請求體,僅需通過請求頭傳入認(rèn)證信息。

  • model:使用的模型標(biāo)識,例如 "GLM-4-9B"。
  • messages:對話消息數(shù)組,每條消息需要包含role(如 "user" 或 "assistant")和content。
  • 其他可選參數(shù):例如temperature(生成溫度)、max_tokens等,用于控制生成結(jié)果的多樣性和長度。

請求示例

GET https://example.com/v1/infers/937cabe5-d673-47f1-9e7c-2b4de06*****/v1/models HTTP/1.1
Authorization: Bearer YOUR_API_KEY
POST https://example.com/v1/infers/937cabe5-d673-47f1-9e7c-2b4de06*****/v1/chat/completions HTTP/1.1
Content-Type: application/json
Authorization: Bearer YOUR_API_KEY

{
  "model": "******",
  "messages": [
    {"role": "user", "content": "Hello, how are you?"}
  ],
  "temperature": 0.7
}

響應(yīng)示例

{
  "data": [
    {
      "id": "******",
      "description": "最新一代大模型"
    },
    {
      "id": "******",
      "description": "性價比較高的替代方案"
    }
  ]
}
{
  "id": "******",
  "object": "chat.completion",
  "choices": [
    {
      "index": 0,
      "message": {"role": "assistant", "content": "I'm doing well, thank you! How can I help you today?"}
    }
  ],
  "usage": {
    "prompt_tokens": 15,
    "completion_tokens": 25,
    "total_tokens": 40
  }
}

常見問題

在ModelArts Studio(MaaS) 創(chuàng)建API Key后需要等待多久才能生效?

MaaS API Key在創(chuàng)建后不會立即生效,通常需要等待幾分鐘才能生效。

免費ai模型常見問題

更多常見問題 >>
  • 模型轉(zhuǎn)換,即將開源框架的網(wǎng)絡(luò)模型(如Caffe、TensorFlow等),通過ATC(Ascend Tensor Compiler)模型轉(zhuǎn)換工具,將其轉(zhuǎn)換成昇騰AI處理器支持的離線模型。

  • 盤古大模型致力于深耕行業(yè),打造金融、政務(wù)、制造、礦山、氣象、鐵路等領(lǐng)域行業(yè)大模型和能力集,將行業(yè)知識know-how與大模型能力相結(jié)合,重塑千行百業(yè),成為各組織、企業(yè)、個人的專家助手。

  • 華為云云市場云蝠智能為企業(yè)提供包括銷售線索挖掘、語音外呼、電話機器人、智能質(zhì)檢、企業(yè)微信SCRM在內(nèi)的服務(wù)體系,大量的應(yīng)用于地產(chǎn)、金融、教育等行業(yè),為企業(yè)的客戶聯(lián)絡(luò)降本增效

  • 華為云學(xué)院潛心打造,用心打磨的普惠AI體系化好課——《AI專業(yè)學(xué)習(xí)路徑》,讓你系統(tǒng)get AI 技術(shù)!華為云AI專家,多年豐富經(jīng)驗,傾囊相授;一站式學(xué)習(xí)體驗,漸進式賦能,由淺入深,綜合提升技能;還配套學(xué)習(xí)群及時交流群,專家1v1答疑,伴你輕松開啟AI學(xué)習(xí)之旅。普惠AI觸及每個企業(yè),每個開發(fā)者,讓智能無所不及!

  • 近年來越來越多的行業(yè)采用AI技術(shù)提升效率、降低成本,然而AI落地的過程確并不容易,AI在具體與業(yè)務(wù)結(jié)合時常常依賴于業(yè)務(wù)數(shù)據(jù)的采集、處理、模型訓(xùn)練、調(diào)優(yōu)、編排、部署和運維等很多環(huán)節(jié)。華為云ModelArts是全流程AI開發(fā)平臺,包含了AI應(yīng)用的開發(fā)、部署和分享交易,通過解決AI開發(fā)各個環(huán)節(jié)所遇到的核心問題,ModelArts有效解決了AI落地難的問題,將極大促進AI技術(shù)的普惠。本議題將分享ModelArts的主要關(guān)鍵技術(shù)和應(yīng)用案例。

  • ModelArts是一個一站式的開發(fā)平臺,能夠支撐開發(fā)者從數(shù)據(jù)到AI應(yīng)用的全流程開發(fā)過程。包含數(shù)據(jù)處理、模型訓(xùn)練、模型管理、模型部署等操作,并且提供AI Gallery功能,能夠在市場內(nèi)與其他開發(fā)者分享模型。

更多相關(guān)專題