亚洲天堂在线观看樱花,亚洲婷婷综合成人,性感美女一区二区福利

內(nèi)容選擇

內(nèi)容分類

學(xué)堂博客論壇開發(fā)服務(wù) 開發(fā)工具直播視頻用戶

時(shí)間

一周一個(gè)月三個(gè)月

內(nèi)容選擇

全部

內(nèi)容選擇

內(nèi)容分類

學(xué)堂
博客
論壇
開發(fā)服務(wù)
開發(fā)工具
直播
視頻
用戶

時(shí)間

一周
一個(gè)月
三個(gè)月

【深度學(xué)習(xí)】嘿馬深度學(xué)習(xí)系統(tǒng)性知識(shí)教程第6篇：深度學(xué)習(xí)進(jìn)階,2.4 BN與神經(jīng)網(wǎng)絡(luò)調(diào)優(yōu)【附代碼文檔】

?????????? https://gitee.com/yinuo112/AI/blob/master/深度學(xué)習(xí)/嘿馬深度學(xué)習(xí)系統(tǒng)性知識(shí)教程/note.md ???? ??????全教程總章節(jié) ??????本篇主要內(nèi)容深度學(xué)習(xí)進(jìn)階知道softmax回歸的原理應(yīng)用softmax_cross_entro

開發(fā)者 > 博客

作者：程序員一諾python

發(fā)表時(shí)間： 2025-08-16 06:44:37

1

0
優(yōu)化擴(kuò)散模型的收斂速度：從理論到實(shí)踐

output 3. 跨模型共享知識(shí)：跨域遷移學(xué)習(xí) 跨模型共享知識(shí)是另一個(gè)加速收斂的有效策略。在許多應(yīng)用中，訓(xùn)練一個(gè)新的擴(kuò)散模型通常需要大量的計(jì)算資源和數(shù)據(jù)集。但如果我們能夠?qū)⒁呀?jīng)訓(xùn)練好的模型（例如圖像生成模型）應(yīng)用到新的任務(wù)中，就能夠大幅加快模型的收斂速度，這種方法被稱為遷移學(xué)習(xí)。在擴(kuò)散模型中應(yīng)用遷移學(xué)習(xí)

開發(fā)者 > 博客

作者：檸檬味擁抱1

發(fā)表時(shí)間： 2025-03-13 13:18:37

0

0
深度學(xué)習(xí)之深度模型中的優(yōu)化

深度學(xué)習(xí)算法在許多情況下都涉及到優(yōu)化。例如，模型中的進(jìn)行推斷（如 PCA）涉及到求解優(yōu)化問題。我們經(jīng)常使用解析優(yōu)化去證明或設(shè)計(jì)算法。在深度學(xué)習(xí)涉及到的諸多優(yōu)化問題中，最難的是神經(jīng)網(wǎng)絡(luò)訓(xùn)練。甚至是用幾百臺(tái)機(jī)器投入幾天到幾個(gè)月來解決單個(gè)神經(jīng)網(wǎng)絡(luò)訓(xùn)練問題，也是很常見的。因?yàn)檫@其中的優(yōu)化

開發(fā)者 > 其他

作者：小強(qiáng)鼓掌

發(fā)表時(shí)間： 2021-09-30 02:33:00.0

338

1
千億參數(shù)的盤古大模型是如何煉成的？

跳躍，而在深度學(xué)習(xí)這個(gè)臺(tái)階上，大模型已經(jīng)站在了最前面，等待著下一個(gè)臺(tái)階的出現(xiàn)。” 當(dāng)前盤古系列超大規(guī)模預(yù)訓(xùn)練模型，包括NLP大模型、CV大模型、多模態(tài)大模型、和科學(xué)計(jì)算大模型。模型大意味著它吸收了海量數(shù)據(jù)知識(shí)，以盤古NLP大模型為例，它學(xué)習(xí)了40TB的中文文本數(shù)據(jù)；盤

開發(fā)者 > 博客

作者：華為云頭條

發(fā)表時(shí)間： 2021-07-09 11:41:43

2296

0
深度學(xué)習(xí)之Bagging的集成模型

步的Dropout觀點(diǎn)。Dropout不僅僅是訓(xùn)練一個(gè)Bagging的集成模型，并且是共享隱藏單元的集成模型。這意味著無論其他隱藏單元是否在模型中，每個(gè)隱藏單元必須都能夠表現(xiàn)良好。隱藏單元必須準(zhǔn)備好進(jìn)行模型之間的交換和互換。Hinton et al. (2012c) 由生物學(xué)的想

開發(fā)者 > 其他

作者：小強(qiáng)鼓掌

發(fā)表時(shí)間： 2021-08-21 05:40:41

2181

6
分享適合科學(xué)研究深度學(xué)習(xí)模型（五）

RL）。強(qiáng)化學(xué)習(xí)的變體包括逆向強(qiáng)化學(xué)習(xí)、階層強(qiáng)化學(xué)習(xí)和部分可觀測(cè)系統(tǒng)的強(qiáng)化學(xué)習(xí)。求解強(qiáng)化學(xué)習(xí)問題所使用的算法可分為策略搜索算法和值函數(shù)（value function）算法兩類。深度學(xué)習(xí) 模型可以在強(qiáng)化學(xué)習(xí)中得到使用，形成深度強(qiáng)化學(xué)習(xí) 。強(qiáng)化學(xué)習(xí)模型設(shè)計(jì)需要考慮三方面：一，如何表示狀態(tài)空間和動(dòng)作空間。二，如

開發(fā)者 > 其他

作者：初學(xué)者7000

發(fā)表時(shí)間： 2021-02-24 13:09:43.0

1939

6
為什么構(gòu)建深度學(xué)習(xí)模型需要使用GPU

在深度學(xué)習(xí)中，深度學(xué)習(xí)模型有兩個(gè)主要的操作，也就是前向傳遞和后向傳遞。前向傳遞將輸入數(shù)據(jù)通過神經(jīng)網(wǎng)絡(luò)后生成輸出；后向傳遞根據(jù)前向傳遞得到的誤差來更新神經(jīng)網(wǎng)絡(luò)的權(quán)重。在矩陣中，我們知道計(jì)算矩陣就是第一個(gè)數(shù)組的行與第二個(gè)數(shù)組的列元素分別相乘。因此，在神經(jīng)網(wǎng)絡(luò)中，我們可以將第一個(gè)矩陣視

開發(fā)者 > 其他

作者： yyy7124

發(fā)表時(shí)間： 2020-11-16 13:32:04

844

1
分享適合科學(xué)研究深度學(xué)習(xí)模型

熱門的任務(wù)已經(jīng)取得了一些進(jìn)展。當(dāng)前需要處理序列數(shù)據(jù)的核心人物包括：語言建模、序列到序列轉(zhuǎn)換、問答等深度學(xué)習(xí)模型那么多，科學(xué)研究選哪個(gè)？序列到序列預(yù)測(cè)任務(wù)的圖示語言建模（Next Token Prediction）作為一種訓(xùn)練方法，將時(shí)間或者位置t的序列標(biāo)記作為輸入，然后用這些

開發(fā)者 > 其他

作者：初學(xué)者7000

發(fā)表時(shí)間： 2021-08-30 15:54:58

1261

5
深度學(xué)習(xí)——VGG16模型詳解-轉(zhuǎn)載

很明顯：即訓(xùn)練時(shí)間過長(zhǎng)，調(diào)參難度大。需要的存儲(chǔ)容量大，不利于部署。 5、VGG模型所需要的內(nèi)存容量借鑒一下大佬的圖： 6、總結(jié) 通過增加深度能有效地提升性能； VGG16是最佳的模型，從頭到尾只有3x3卷積與2x2池化，簡(jiǎn)潔優(yōu)美；卷積可代替全連接，可適應(yīng)各種尺寸

開發(fā)者 > 其他

作者：澤宇-Li

發(fā)表時(shí)間： 2022-12-03 14:31:26

72

2
分享適合科學(xué)研究深度學(xué)習(xí)模型（一）

卷積神經(jīng)網(wǎng)絡(luò) 多層感知機(jī)只是簡(jiǎn)單的深度網(wǎng)絡(luò)，在它的基礎(chǔ)上，卷積神經(jīng)網(wǎng)絡(luò)發(fā)展了起來，成為了最廣為人知的神經(jīng)網(wǎng)絡(luò)家族，其特有的卷積層允許許神經(jīng)網(wǎng)絡(luò)在圖像的不同空間位置重復(fù)使用參數(shù)。作為一種對(duì)圖像數(shù)據(jù)非常有用的歸納偏差，能夠幫助更加有效地學(xué)習(xí)一些好特征以應(yīng)用層面來分，卷積神經(jīng)網(wǎng)絡(luò)派

開發(fā)者 > 其他

作者：初學(xué)者7000

發(fā)表時(shí)間： 2021-02-19 02:33:58

1139

4
分享適合科學(xué)研究深度學(xué)習(xí)模型（四）

的神經(jīng)網(wǎng)絡(luò)模型，其中編碼器神經(jīng)網(wǎng)絡(luò)接收輸入序列并學(xué)習(xí)提取重要特征，然后解碼器神經(jīng)網(wǎng)絡(luò)使用該特征來產(chǎn)生目標(biāo)輸出。該范式已經(jīng)用于生物學(xué)和能源預(yù)測(cè)，其中在里面發(fā)揮重要作用的是Attention技術(shù)。遞歸神經(jīng)網(wǎng)絡(luò)模型的示意圖問答也能夠作為處理序列數(shù)據(jù)的一個(gè)基準(zhǔn)，此類神經(jīng)網(wǎng)絡(luò)模型的標(biāo)準(zhǔn)是：

開發(fā)者 > 其他

作者：初學(xué)者7000

發(fā)表時(shí)間： 2021-02-24 13:07:43

1541

1
SPPNet深度學(xué)習(xí)網(wǎng)絡(luò)模型學(xué)總結(jié)

4個(gè)百分點(diǎn)。5.1. SPPNet的缺點(diǎn)（改進(jìn)點(diǎn)）：1. 模型訓(xùn)練仍然很復(fù)雜：和RCNN一樣，訓(xùn)練多級(jí)流水線，分別隔離訓(xùn)練三個(gè)模型：CNN fine-tuning模型（提取圖像特征）、SVM分類器（預(yù)測(cè)類別）、回歸模型（修正邊界），大量的中間結(jié)果需要轉(zhuǎn)存，無法整體訓(xùn)練參數(shù)。2.

開發(fā)者 > 其他

作者：小二中二大二

發(fā)表時(shí)間： 2021-03-01 06:43:37

2042

0
適合新手的深度學(xué)習(xí)綜述（6）--深度生成模型

進(jìn)行文檔處理的深度生成模型。6.3 深度信念網(wǎng)絡(luò)深度信念網(wǎng)絡(luò) (Deep Belief Networks, DBN) 是具有多個(gè)潛在二元或真實(shí)變量層的生成模型。Ranzato 等人 (2011) 利用深度信念網(wǎng)絡(luò) (deep Belief Network, DBN) 建立了深度生成模型進(jìn)行圖像識(shí)別。6

開發(fā)者 > 其他

作者： @Wu

發(fā)表時(shí)間： 2022-05-30 07:52:37

157

1
深度學(xué)習(xí)正在顛覆醫(yī)學(xué)成像！

說白了，就是 AI 既能當(dāng)“顯微鏡”，又能當(dāng)“放大鏡”，還能幫你做綜合判斷。三、一個(gè)小實(shí)驗(yàn)：用深度學(xué)習(xí)識(shí)別肺炎 X 光來點(diǎn)實(shí)戰(zhàn)！咱用 Python + Keras 寫個(gè)簡(jiǎn)化版模型，演示一下如何用深度學(xué)習(xí)識(shí)別 X 光片是否有肺炎。 import tensorflow as tf

開發(fā)者 > 博客

作者： Echo_Wish

發(fā)表時(shí)間： 2025-09-25 12:43:48

0

0
從AI大模型的角度來看深度學(xué)習(xí)

從AI大模型的角度來看，深度學(xué)習(xí)是一種基于多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的機(jī)器學(xué)習(xí)方法。這種方法通過使用多個(gè)層次的非線性變換，能夠從原始數(shù)據(jù)中學(xué)習(xí)到復(fù)雜的表示和特征。這些表示和特征對(duì)于解決各種任務(wù)非常有用，包括圖像識(shí)別、語音識(shí)別、自然語言處理等。在AI大模型中，深度學(xué)習(xí)被廣泛應(yīng)用于構(gòu)建各種類型

開發(fā)者 > 其他

作者：運(yùn)氣男孩

發(fā)表時(shí)間： 2024-02-29 15:06:24.0

28

1
深度學(xué)習(xí)之結(jié)構(gòu)化概率模型

可以通過邊互相連接的頂點(diǎn)的集合構(gòu)成。當(dāng)我們用圖來表示這種概率分布的因子分解，我們把它稱為結(jié)構(gòu)化概率模型 (structured probabilistic model) 或者圖模型 (graphical model)。

開發(fā)者 > 其他

作者：小強(qiáng)鼓掌

發(fā)表時(shí)間： 2021-02-15 06:00:35.0

1078

4
深度學(xué)習(xí)模型的中毒攻擊與防御綜述

深度學(xué)習(xí)是當(dāng)前機(jī)器學(xué)習(xí)和人工智能興起的核心。隨著深度學(xué)習(xí)在自動(dòng)駕駛、門禁安檢、人臉支付等嚴(yán)苛的安全領(lǐng)域中廣泛應(yīng)用，深度學(xué)習(xí)模型的安全問題逐漸成為新的研究熱點(diǎn)。深度模型的攻擊根據(jù)攻擊階段可分為中毒攻擊和對(duì)抗攻擊，其區(qū)別在于前者的攻擊發(fā)生在訓(xùn)練階段，后者的攻擊發(fā)生在測(cè)試階段。論文首次

開發(fā)者 > 其他

作者： yyy7124

發(fā)表時(shí)間： 2021-01-10 10:58:14.0

1357

5
分享適合科學(xué)研究深度學(xué)習(xí)模型（二）

息互聯(lián)網(wǎng)等等。相比于傳統(tǒng)的圖模型，圖網(wǎng)絡(luò)最大的優(yōu)勢(shì)在于它不只可以對(duì)一個(gè)節(jié)點(diǎn)進(jìn)行語義表示。可以把圖神經(jīng)網(wǎng)絡(luò)看做將深度學(xué)習(xí)技術(shù)應(yīng)用到符號(hào)表示的圖數(shù)據(jù)上，或者說是從非結(jié)構(gòu)化數(shù)據(jù)擴(kuò)展到了結(jié)構(gòu)化數(shù)據(jù)。應(yīng)用特點(diǎn)：數(shù)據(jù)具有固有的圖形結(jié)構(gòu)特點(diǎn)，能夠在圖結(jié)構(gòu)上學(xué)習(xí)到一些函數(shù)，無論是某些頂點(diǎn)，還是全局都可以。

開發(fā)者 > 其他

作者：初學(xué)者7000

發(fā)表時(shí)間： 2021-02-21 15:03:59.0

1054

2
半精度和全精度下模型不收斂
半精度和全精度下模型不收斂

訓(xùn)練Resnet，Vit，Cswin時(shí)，設(shè)置amp_level="O2"（半精度）時(shí)，cswin不收斂，vit，resnet收斂，而設(shè)置amp_level="O0"（全精度）時(shí)，三個(gè)模型都正常收斂。一致找不到原因？有誰知道可能的原因嗎？

開發(fā)者 > 其他

作者： yd_299963712

發(fā)表時(shí)間： 2022-06-23 01:39:06.0

457

4
分享適合科學(xué)研究深度學(xué)習(xí)模型（三）

譯和問題回答兩個(gè)熱門的任務(wù)已經(jīng)取得了一些進(jìn)展。當(dāng)前需要處理序列數(shù)據(jù)的核心人物包括：語言建模、序列到序列轉(zhuǎn)換、問答等深度學(xué)習(xí)模型那么多，科學(xué)研究選哪個(gè)？序列到序列預(yù)測(cè)任務(wù)的圖示語言建模（Next Token Prediction）作為一種訓(xùn)練方法，將時(shí)間或者位置t的序列標(biāo)記作為輸入

開發(fā)者 > 其他

作者：初學(xué)者7000

發(fā)表時(shí)間： 2021-02-22 23:10:08

1026

1

總條數(shù)： 400

點(diǎn)擊加載更多

您搜索到想要的結(jié)果了嗎？

是的沒搜到

意見反饋

/200

提交反饋取消