檢測到您已登錄華為云國際站賬號,為了您更好的體驗(yàn),建議您訪問國際站服務(wù)網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
還介紹了神經(jīng)元模型的起源和全連接層的概念,以及ReLU等激活函數(shù)的作用。深度學(xué)習(xí)的核心是構(gòu)建多層的神經(jīng)網(wǎng)絡(luò),而卷積神經(jīng)網(wǎng)絡(luò)(CNN)的發(fā)展,尤其是AlexNet在2012年的突破,讓我對深度學(xué)習(xí)的強(qiáng)大能力有了更深的認(rèn)識。在學(xué)習(xí)過程中,我也了解到了不同的深度學(xué)習(xí)開發(fā)框架,包括The
組件學(xué)習(xí)組件學(xué)習(xí)不僅使用一個(gè)模型的知識,還使用多個(gè)模型的知識。人們相信,通過獨(dú)特的信息組合或輸入(包括靜態(tài)和動(dòng)態(tài)),深度學(xué)習(xí)可以比單一模式更深入地理解和表現(xiàn)。遷移學(xué)習(xí)是組件學(xué)習(xí)的一個(gè)非常明顯的例子?;谶@一思想,對類似問題預(yù)先訓(xùn)練的模型權(quán)重可用于對特定問題進(jìn)行微調(diào)。為了區(qū)分不同類
長短期記憶(Long short-term memory, LSTM)是一種特殊的RNN,主要是為了解決長序列訓(xùn)練過程中的梯度消失和梯度爆炸問題。簡單來說,就是相比普通的RNN,LSTM能夠在更長的序列中有更好的表現(xiàn)。
什么是深度?深度就是簡單的量變。神經(jīng)網(wǎng)絡(luò)到深度神經(jīng)網(wǎng)絡(luò),就是每一層的節(jié)點(diǎn)搞多一點(diǎn),層數(shù)也搞多一點(diǎn)。但是如果說網(wǎng)絡(luò)越深,節(jié)點(diǎn)越多,表現(xiàn)能力就越好,這個(gè)我看未必,過猶未及嘛深度神經(jīng)網(wǎng)絡(luò)本身沒再多講,講的是卷積神經(jīng)網(wǎng)絡(luò)就是CNN。這個(gè)是在60年代的時(shí)候,在研究貓的神經(jīng)元時(shí)發(fā)現(xiàn)的,199
理解神經(jīng)網(wǎng)絡(luò)基本原理及常見深度學(xué)習(xí)算法的結(jié)構(gòu)和基本原理。
機(jī)器學(xué)習(xí)算法是一種可以從數(shù)據(jù)中學(xué)習(xí)的算法。然而,我們所謂的 “學(xué)習(xí)”是什么意思呢?Mitchell (1997) 提供了一個(gè)簡潔的定義:“對于某類任務(wù) T 和性能度量P,一個(gè)計(jì)算機(jī)程序被認(rèn)為可以從經(jīng)驗(yàn) E 中學(xué)習(xí)是指,通過經(jīng)驗(yàn) E 改進(jìn)后,它在任務(wù) T 上由性能度量
像上一節(jié)介紹的一樣,要訓(xùn)練深度學(xué)習(xí)模型也需要準(zhǔn)備訓(xùn)練數(shù)據(jù),數(shù)據(jù)也是分為兩部分,一部分是驗(yàn)證碼圖像,另一部分是數(shù)據(jù)標(biāo)注,即缺口的位置。但和上一節(jié)不一樣的是,這次標(biāo)注不再是單純的驗(yàn)證碼文本了,因?yàn)檫@次我們需要表示的是缺口的位置,缺口對應(yīng)的是一個(gè)矩形框,要表示一個(gè)矩形框,至少需要四個(gè)數(shù)據(jù),如左上角點(diǎn)的橫縱坐標(biāo)
Gated Recurrent Unit – GRU 是 LSTM 的一個(gè)變體。他保留了 LSTM 劃重點(diǎn),遺忘不重要信息的特點(diǎn),在long-term 傳播的時(shí)候也不會(huì)被丟失。
這種學(xué)習(xí)范式試圖跨越監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)之間的界限。由于缺少標(biāo)簽數(shù)據(jù)和收集標(biāo)簽數(shù)據(jù)集的高成本,它通常用于業(yè)務(wù)環(huán)境中。從本質(zhì)上講,混合學(xué)習(xí)就是這個(gè)問題的答案。我們?nèi)绾问褂帽O(jiān)督學(xué)習(xí)方法來解決或聯(lián)系非監(jiān)督學(xué)習(xí)問題?例如,半監(jiān)督學(xué)習(xí)在機(jī)器學(xué)習(xí)領(lǐng)域正變得越來越流行,因?yàn)樗梢院芎玫靥幚?/p>
機(jī)器學(xué)習(xí)算法是一種可以從數(shù)據(jù)中學(xué)習(xí)的算法。然而,我們所謂的 ‘‘學(xué)習(xí)’’ 是什么意思呢?Mitchell (1997) 提供了一個(gè)簡潔的定義:‘‘對于某類任務(wù) T 和性能度量P,一個(gè)計(jì)算機(jī)程序被認(rèn)為可以從經(jīng)驗(yàn) E 中學(xué)習(xí)是指,通過經(jīng)驗(yàn) E 改進(jìn)后,它在任務(wù) T 上由性能度量 P 衡量的性能有所提升。”
目錄 先來看機(jī)器學(xué)習(xí): 什么是特征? 深度學(xué)習(xí)是表示學(xué)習(xí)的經(jīng)典代表: 深度學(xué)習(xí)的過程: 深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)差別: 深度學(xué)習(xí)代表算法: 先來看機(jī)器學(xué)習(xí): 機(jī)器學(xué)習(xí)是利用經(jīng)驗(yàn)experience來改善 計(jì)算機(jī)系統(tǒng)自身的性能,通過經(jīng)驗(yàn)獲取知識knowledge。 以往都是人們向
得到更好的性能。學(xué)習(xí)率,即參數(shù)到達(dá)最優(yōu)值過程的速度快慢,當(dāng)你學(xué)習(xí)率過大,即下降的快,很容易在某一步跨過最優(yōu)值,當(dāng)你學(xué)習(xí)率過小時(shí),長時(shí)間無法收斂。因此,學(xué)習(xí)率直接決定著學(xué)習(xí)算法的性能表現(xiàn)。?可以根據(jù)數(shù)據(jù)集的大小來選擇合適的學(xué)習(xí)率,當(dāng)使用平方誤差和作為成本函數(shù)時(shí),隨著數(shù)據(jù)量的增多,學(xué)
得到更好的性能。學(xué)習(xí)率,即參數(shù)到達(dá)最優(yōu)值過程的速度快慢,當(dāng)你學(xué)習(xí)率過大,即下降的快,很容易在某一步跨過最優(yōu)值,當(dāng)你學(xué)習(xí)率過小時(shí),長時(shí)間無法收斂。因此,學(xué)習(xí)率直接決定著學(xué)習(xí)算法的性能表現(xiàn)。?可以根據(jù)數(shù)據(jù)集的大小來選擇合適的學(xué)習(xí)率,當(dāng)使用平方誤差和作為成本函數(shù)時(shí),隨著數(shù)據(jù)量的增多,學(xué)
解決這個(gè)問題的途徑之一是使用機(jī)器學(xué)習(xí)來發(fā)掘表示本身,而不僅僅把表示映射到輸出。這種方法我們稱之為表示學(xué)習(xí)(representation learning)。學(xué)習(xí)到的表示往往比手動(dòng)設(shè)計(jì)的表示表現(xiàn)得更好。并且它們只需最少的人工干預(yù),就能讓AI系統(tǒng)迅速適應(yīng)新的任務(wù)。表示學(xué)習(xí)算法只需幾分
Transformers)模型,采用遷移學(xué)習(xí)和微調(diào)的方法,進(jìn)一步刷新了深度學(xué)習(xí)方法在自然語言處理任務(wù)上的技術(shù)前沿。到目前為止,面向自然語言處理任務(wù)的深度學(xué)習(xí)架構(gòu)仍在不斷進(jìn)化,與強(qiáng)化學(xué)習(xí)、無監(jiān)督學(xué)習(xí)等的結(jié)合應(yīng)該會(huì)帶來效果更優(yōu)的模型。1.3.4 其他領(lǐng)域深度學(xué)習(xí)在其他領(lǐng)域(如生物學(xué)、醫(yī)療和金融
回想一下Bagging學(xué)習(xí),我們定義 k 個(gè)不同的模型,從訓(xùn)練集有替換采樣構(gòu)造k 個(gè)不同的數(shù)據(jù)集,然后在訓(xùn)練集 i 上訓(xùn)練模型 i。Dropout的目標(biāo)是在指數(shù)級數(shù)量的神經(jīng)網(wǎng)絡(luò)上近似這個(gè)過程。具體來說,在訓(xùn)練中使用Dropout時(shí),我們會(huì)使用基于小批量的學(xué)習(xí)算法和較小的步長,如梯度下降
1.2 深度學(xué)習(xí)框架目前大部分深度學(xué)習(xí)框架都已開源,不僅提供了多種多樣的接口和不同語言的API,而且擁有詳細(xì)的文檔和活躍的社區(qū),因此設(shè)計(jì)網(wǎng)絡(luò)更加靈活和高效。另外,幾乎所有的深度學(xué)習(xí)框架都支持利用GPU訓(xùn)練模型,甚至在單機(jī)多卡和分布式訓(xùn)練方面都有很好的支持,因此訓(xùn)練模型的時(shí)間也大大
深度學(xué)習(xí)是目前人工智能最受關(guān)注的領(lǐng)域,但黑盒學(xué)習(xí)法使得深度學(xué)習(xí)面臨一個(gè)重要的問題:AI能給出正確的選擇,但是人類卻并不知道它根據(jù)什么給出這個(gè)答案。本期將分享深度學(xué)習(xí)的起源、應(yīng)用和待解決的問題;可解釋AI的研究方向和進(jìn)展。
機(jī)器學(xué)習(xí)的主要挑戰(zhàn)是我們的算法必須能夠在先前未觀測的新輸入上表現(xiàn)良好,而不只是在訓(xùn)練集上效果好。在先前未觀測到的輸入上表現(xiàn)良好的能力被稱為泛化(generalization)。通常情況下,當(dāng)我們訓(xùn)練機(jī)器學(xué)習(xí)模型時(shí),我們可以訪問訓(xùn)練集,在訓(xùn)練集上計(jì)算一些度量誤差,被稱為訓(xùn)練誤差(training
機(jī)器學(xué)習(xí)的主要挑戰(zhàn)是我們的算法必須能夠在先前未觀測的新輸入上表現(xiàn)良好,而不只是在訓(xùn)練集上效果好。在先前未觀測到的輸入上表現(xiàn)良好的能力被稱為泛化(generalization)。通常情況下,當(dāng)我們訓(xùn)練機(jī)器學(xué)習(xí)模型時(shí),我們可以訪問訓(xùn)練集,在訓(xùn)練集上計(jì)算一些度量誤差,被稱為訓(xùn)練誤差(training