百度推出對應多模態運作的ERNIE 4.5、ERNIE X1模型,標榜使用成本比DeepSeek更低能同時理解文字、圖像、聲音與影片內容,同時也能理解內容描述情境,更可理解網路迷因與諷刺漫畫