AI
AI 分支
- 專家系統:模擬人類專家的系統,其性能取決於專家的知識與經驗。
- 預測型 AI:利用深度學習進行數據分析,運用歷史數據預測趨勢,並可以利用非監督式學習發現數據中的隱含規則。
- 生成型 AI:
- AIGC (AI Generated Content):使用 AI 生成內容。
- 生成式 AI (GAI):基於專家團隊 (PGC)、用戶 (UGC) 與生成式平台的演算法。
AI Model 演進
- 機器學習模型:通過試錯法與反思來積累經驗。
- 類神經網路模型:模擬人腦神經信號處理與思維過程。
- 生成式演算法模型:對輸入數據的概率分布建模,生成新數據。
- 語言模型:用於執行各種自然語言處理任務並理解人類語言。
- 大規模預訓練模型:能根據上下文進行互動,並以類似人類的方式進行對話。
- 大型語言模型 (LLM)
提示
梯度消失 (Gradient Vanishing):
指在深層神經網絡中,由於梯度在反向傳播過程中逐層變小,導致靠近輸入層的權重更新非常緩慢甚至停止,影響模型的訓練效果。該問題可以通過使用 ReLU 激活函數、適當的權重初始化(如 He 初始化或 Xavier 初始化)、批量歸一化(Batch Normalization)、殘差網絡(Residual Networks)和改進的遞歸神經網絡結構(如 LSTM 和 GRU)來解決。