A.一種用于優(yōu)化策略的方法
B.一種用于計(jì)算狀態(tài)值的方法
C.一種用于選擇動(dòng)作的規(guī)則
D.一種用于表示環(huán)境模型的數(shù)據(jù)結(jié)構(gòu)
您可能感興趣的試卷
你可能感興趣的試題
A.智能體可以隨時(shí)選擇任何動(dòng)作
B.環(huán)境的動(dòng)態(tài)會(huì)隨時(shí)間改變
C.下一個(gè)狀態(tài)只取決于當(dāng)前狀態(tài)和采取的動(dòng)作
D.智能體可以看到完整的狀態(tài)空間
A.圖像與圖像疊加
B.樣本與樣本疊加
C.特征與特征疊加
D.標(biāo)簽與標(biāo)簽疊加
A.監(jiān)督學(xué)習(xí)
B.無監(jiān)督學(xué)習(xí)
C.半監(jiān)督學(xué)習(xí)
D.策略梯度
A.InceptionV3
B.Word2Vec
C.GRU
D.ARIMA
A.損失函數(shù)
B.神經(jīng)網(wǎng)絡(luò)層
C.優(yōu)化器
D.激活函數(shù)和其他非層操作
最新試題
在自然語言處理任務(wù)中,哪些技術(shù)適用于提升文本分類的性能()?
智能運(yùn)維AIOps 的核心技術(shù)是什么()?
人工智能發(fā)展的早期階段主要側(cè)重于哪方面的研究()?
模型微調(diào)中的提示學(xué)習(xí)是指:()。
依存句法分析(DependencyParsing)主要用于分析什么()?
人工智能中的“序列到序列”模型主要用于處理什么類型的數(shù)據(jù)()?
反向傳播算法和梯度下降算法在神經(jīng)網(wǎng)絡(luò)訓(xùn)練中的關(guān)系是什么()?
在強(qiáng)化學(xué)習(xí)中,什么是“馬爾可夫性質(zhì)”()?
在深度學(xué)習(xí)模型中,用于提高模型訓(xùn)練穩(wěn)定性的技術(shù)是:()。
在自然語言處理中,哪些技術(shù)可以用于改善實(shí)體識別和文本生成任務(wù)的性能()?