NVIDIA 史上最強繪畫 AI:畫個圓圈和直線,自動幫你做出超逼真「假海灘」照片

【為什麼我們要挑選這篇文章】昨(18)日是 Nvidia 的技術大會,Nvidia 首次展示 GauGAN,只要簡單畫上幾筆,AI 就會模擬出逼真的照片。雖然 GauGAN 還只是個概念的證明,但此技術在遊戲、電影和其他視覺領域有不少的應用前景。

除了 GauGAN,我們也來看看這次大會上其他的科技新物吧!(責任編輯:郭家宏)

輝達(Nvidia)2019GPU 技術大會(GTC19)18 日在美國加州聖荷西舉行。在這一嚴重拖堂、長達 2 小時 40 分鐘的 Keynote 演講中,輝達創始人兼首席執行官黃仁勛火力全開,宣佈了該公司在軟體、機器學習平台,以及自動駕駛上的一系列新動作。

大數據文摘對其演講的核心內容做了梳理,先來看看整場發佈會最讓人精神振奮的部分—— AI 遊樂場。

輝達「遊樂場」:正式發佈「馬良神筆」GauGAN,草圖生成擬真照片

草草畫幾筆就能變成超真實的畫面。這一之前只在論文中出現就火爆了社交圈的「神操作」今天終於在大會現場實操發佈了。

黃教主親自操刀展示了這項技術的工作原理。他使用畫筆在畫布上簡單的描繪,然後模型在輸出圖象的相應位置生成了真實的圖象。生成的內容與場景其餘部分毫無違和感,簡直是馬良神筆啊。

(TO 編按:馬良神筆是中國傳說,有個叫馬良的人獲得一支神筆,用它畫出來的東西會變成真的。意旨一個人繪畫技巧高超。)

這是輝達在本次大會上發佈的其最新的圖象處理研究成果 GauGAN ——一種基於生成式對抗網絡的技術,能夠將分割的圖片轉換成真實的照片。

其實,GauGAN 的研究論文已被 CVPR 2019 作為口頭報告收錄,並且因為其強大的功效早已在社交圈火了一把。

輝達稱,GauGAN 的相關研究是在之前 pix2pixHD 基礎上進行的改進,新模型的參數較少,可生成的圖象選項較多。訓練數據是英偉達從 Flickr 收集的,包含 100 萬張圖片。

該模型允許用戶更改生成的圖象,例如將白天場景更改為日落,等等。

輝達這一研究的效果與去年 11 月由麻省理工學院(MIT)、IBM、谷歌和香港中文大學研究人員合力發表的一篇論文相似。在論文中,其提出的 GANPATE 可以使任何人都能畫出極其複雜和詳細的「真實」場景。這兩篇論文幾乎是同時提出的,但採用了不同的技術,並被設計用於不同的場景。

雖然 GauGAN 仍然是一個概念的證明,但該技術在遊戲、電影製作和許多其他視覺展示領域有潛在的應用前景。例如,遊戲設計者可以利用該技術更快、更有效地呈現更真實的模擬環境。

在大會首次亮相的還有 Nvidia AI Playground(輝達 AI 遊樂場),這是一個綜合性 AI 訓練網站,人們可以在這裡完成各種神經網絡的訓練,包括今天大會現場演示的把草稿變成圖片的 GauGAN。

之前大火的神奇照片修復功能

神奇的藝術風格轉化效果

以及面部圖象合成器

這些酷炫的效果讓凌晨 5 點起床看發佈會的文摘菌一掃睏倦,被稱為「遊樂場」確實名副其實。感興趣的同學可以 進去玩一下

當然,除了好玩的「遊樂場」平台,輝達也在本次發佈會發佈了幾個硬體。

發佈新的 Tesla T4 晶片

雖然消費市場尚未大規模普及,但輝達依然將其作為一個重點領域孜孜不倦的開發,其在本次峰會上最新發佈了一款 Tesla T4 晶片。

黃教主在大會上表示,第二代基於 Tensor Core 的 GPU 硬體過時了,其最新 Tesla T4 晶片具有 64GB 的 GDDR6 超快速 VRAM 內存,同時在可部署的服務器安裝中使用 4x T4 卡。使得分佈式計算的速度大大加快,將「超大規模」計算降整合到了機架式(a rack mount)。

輝達 T4 GPU 加速了各種雲端工作負載,包括高性能計算、深度學習訓練和推理、機器學習、數據分析。基於新的圖靈™架構,只消耗能源 70W,可謂非常節能。另外, T4 優化主流計算環境,並具有多精度圖靈張量核心和新的 RT 核心。結合 NVIDIA GPU Cloud(NGC)的加速容器化軟件棧,T4 在規模上提供顛覆式的性能。

總的來說,該卡採用單插槽設計,只有 6.6 英吋長,並使用 PCIe Gen3。 使用新的 TU104 Nvidia GPU,16 GB GDDRT6 和僅 70W 的最大功率限制意味著它可以輕鬆散熱。 另外其支持 8x 和 16x PCIe。

CUDA X AI 平台公開,發佈專為數據科學發佈的新一代整合工作站

本次發佈會上,輝達推出了端到端機器學習平台 CUDA-X AI 平台。

輝達稱,NVIDIA CUDA-X AI 正在改變數據科學,提高開發人員的工作效率,加速深度學習,機器學習和數據分析的工作流程,它已整合到主要的深度學習框架中,如 TensorFlow、PyTorch 和 MXNet,並且已經被 Charter、Microsoft、PayPal 和 Walmart 等頂級公司所使用。

輝達稱,CUDA-X AI 廣泛可用。其軟體加速庫整合到所有深度學習框架中,包括 TensorFlow、PyTorch 和 MXNet,以及流行的數據科學軟體,如 RAPIDS。也可適用各類雲平台,包括 AWS、Microsoft Azure 和 Google Cloud。CUDA-X AI 庫可以部署在 NVIDIA GPU 上的任何地方,包括台式機、工作站、服務器、雲端計算和物聯網(IoT)設備。

上週,Nvidia 正式宣佈以 69 億美元(約新台幣 2070 元)的超高價格收購了 Mellanox,可以看出數據中心對輝達未來的重要性。

本次峰會上,輝達也專門為數據科學工作者推出了新一代整合工作站。黃教主稱,數據從根本上改變了公司的業務方式,推動了對數據科學家的需求,並增加了工作流程的複雜性。但數據科學家的時間非常昂貴,他們開發模型所需的計算資源需求量很大。如果他們花費數小時甚至數天從源頭編譯框架只是為了發現錯誤,那就是生產力,收入和競爭優勢的損失。

成千上萬的數據科學家和開發人員已經推出了性能優化的深度學習框架容器,如 TensorFlow 和 PyTorch,輔助跳過耗時且容易出錯的部署步驟,專注於構建他們的解決方案。

輝達本次擴展了 NGC 軟件中心,為數據科學家提供了更快地構建優化解決方案的工具,黃教主稱,不同行業需要定製的流程和軟體,NGC 目前已經為智慧城市和醫學成像提供了行業特定的工作流程。

同時,輝達將 Quadro RTX GPU 的強大功能與加速的 CUDA-X AI 數據科學軟體相結合,為數據科學提供新一代完全整合的工作站。

這一數據科學工作站配備了一整套經過測試和優化的數據科學軟體。該堆棧具有 RAPIDS 數據處理和機器學習庫,輝達優化的 TensorFlow、PyTorch、Caffe 和其他領先的數據科學軟體,為企業提供加速工作流程,以加快數據準備,模型培訓和數據可視化。

結合 Quadro RTX GPU 的強大功能與 RAPIDS 的加速相結合,輝達希望通過這一工作站縮短模型訓練時間並提供最快的數據科學解決辦法。

在 RTX 8000 上使用 RAPIDS 實現端到端更快的速度

本次大會上,黃仁勛也正式發佈了機器人開發者工具箱 Jetson Nano,可以為機器人設計引入 AI 算力。

Jetson Nano 是一款類似於樹莓派的嵌入式電腦設備,其搭載了四核 Cortex-A57 處理器,GPU 則是擁有 128 個 NVIDIA CUDA 核心的 NVIDIA 麥克斯韋架構顯卡,內存 4GB LPDDR4,存儲則為 16GB eMMC 5.1,支持 4K 60Hz 影片解碼。

Jetson Nano 支持高解析度感測器,可以並行處理多個感測器,並可在每個感測器流上運行多個現代神經網絡。它還支持許多流行的 AI 框架,使開發人員可以輕鬆地將他們喜歡的模型和框架整合到產品中。

Jetson Nano 有兩個版本 – 面向開發人員,製造商的 99 美元(約 2970 新台幣)開發套件以及面向希望創建大眾市場邊緣系統的 129 美元(約 3870 新台幣)生產就緒模組,將於 6 月開始發貨。兩者都將通過 NVIDIA 的主要全球分銷商進行銷售。開發人員套件也可以從製造商管道,Seeed Studio 和 SparkFun 購買。

使用 Unity 引擎進行實時光線跟蹤,已應用於汽車設計

光線追蹤是輝達 RTX 平台的殺手鐧,其一直也是 GPU 領域關注的焦點。輝達正在大力推進光線追蹤。

在今天的 GTC 大會上,輝達宣佈與 Unity Technologies 合作,通過 Unity 的高清晰渲染管線(HDRP)為 Unity Engine 帶來實時光線跟蹤,預計在 2019 年下半年會公佈。

Unity 副總裁 Natalya Tatarchuk 稱:在去年輝達推出了高清晰度渲染管道的預覽版,能夠在消費硬體上實時實現驚人的圖形效果。這次與輝達公司合作,RTX 實時光線跟蹤功能很快就能將這項技術普及。“

Unity Technologies 將 Nvidia RTX 光線跟蹤 3D 技術應用於汽車設計。在會上,為了展示光線追蹤功能,輝達播放了寶馬 8 系列跑車的視頻,更加強調了 RTX 帶來的真實性。

光線跟蹤包含在像 Unity Engine 這樣的開放平台中,是實現光線跟蹤的重要一步。此外,在大會上輝達宣佈推出一系列 GeForce GTX 系列顯卡的「基本 RT 效果」和「低光線數(low ray count)」功能。

不過,這一功能對硬體要求也比較高,用戶至少需要配置一個 6GB 的 GeForce GTX 1060。所有 Pascal GPU 都可以通過 TITAN Xp 使用基本的 RT 功能,包括新的基於圖靈架構的 GeForce GTX 1660 和 GTX 1660 Ti 顯卡。要求高功效和多重 RT 效果,就需要 GeForce RTX 2060,2070,2080,2080 Ti 和 TITAN RTX 等晶片了。

推出全新開放交互式 3D 設計協作平台——NVIDIA Omniverse

此外,輝達還推出了一款功能強大的全新開放交互式 3D 設計協作平台——NVIDIA Omniverse。它適用於由 NVIDIA RTX 提供支持的 3D 製作流程。

這是一個開放式協作平台,可簡化實時圖形的工作室工作流程。包括門戶 – 雙向隧道 – 維護行業標準應用程式(如 Autodesk Maya、Adobe Photoshop 和 Epic Games 的虛幻引擎)之間的實時連接。

這個新的開放式協作平台簡化了跨行業的 2D 和 3D 產品管道。Omniverse 圍繞最新的設計協作行業標準而構建,支持 Pixar 的通用場景描述技術,用於在多個應用程式之間交換有關建模,著色,動畫,燈光,視覺效果和渲染的信息。它還支持 NVIDIA 的材料定義語言,允許藝術家跨多個工具交換有關表面材料的信息。

推出 NVIDIA DRIVE Constellation 仿真平台

最後,黃教主也宣佈了輝達在無人駕駛平台上的新動作——推出 NVIDIA DRIVE Constellation 仿真平台。

DRIVE Constellation 是一個數據中心解決方案,包括兩個併排服務器。DRIVE Constellation 由兩個併排的服務器組成,可實現位精確的實時仿真。第一台服務器 – DRIVE Constellation Simulator – 從虛擬汽車生成感測器輸出;第二台服務器 – DRIVE Constellation Vehicle – 包含 DRIVE AGX Pegasus AI 車載電腦。DRIVE AGX Pegasus 接收感測器數據,做出決定,然後將車輛控制命令發送回模擬器。這種閉環過程可實現位精確,定時精確的硬件在環測試。

可以選擇任何天氣、時間模擬駕駛。

輝達稱這種基於雲端的解決方案可以在虛擬環境中驅動數百萬英里的各種場景,從常規駕駛到罕見甚至危險情況,比現實世界中的效率,成本效益和安全性更高:3000 輛車可以每年駕駛超過 10 億英里,且每公里的駕駛都包括罕見或危險場景。

在 GTC 主題演講階段,黃教主演示了 DRIVE Constellation 平台如何執行駕駛測試。DRIVE Constellation 用戶可以通過雲端遠程訪問任何平台。開發人員可以提交一個特定的模擬場景。例如,在潮濕的道路上霧濛濛的夜晚,一輛自動駕駛汽車對另一輛汽車在交通繁忙時切入車道作出反應。

DRIVE Constellation 是一個開放式平台,意味著它提供了一個編程接口,允許 DRIVE Sim 生態系統合作夥伴整合他們的環境模型,車輛模型,感測器模型和交通場景。通過整合各種合作夥伴,該平台可以生成全面,多樣化和複雜的測試環境。

輝達宣佈,已經與最大的汽車生產商之一——豐田達成合作。豐田研究院,高級開發(TRI-AD)將使用 DRIVE Constellation,並擴大雙方合作。TRI-AD 將利用該平台加速自動駕駛汽車的開發和生產時間表,模擬在具有挑戰性的情況下相當於數十億英里的駕駛。

(本文經 大數據文摘 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈 英伟达 GTC 十周年游乐场!黄老板演示马良神笔草图变实景,发布 99 美元迷你 AI 插件 〉 。首圖來源:Nvidia

更多 Nvidia 相關消息

NVIDIA 硬氣出手!砸金 2000 億台幣,出手買下以色列晶片公司 Mellanox

股價翻十倍到營收大跌 24%,深陷晶片景氣低谷的 NVIDIA 能再次翻身?

把 NVIDIA 的造人 AI 拿去創造「貓」會出現什麼?我一定是年假結束還沒醒……


AI、大數據的數據負載量過高嗎?

培養數位轉型力,資料儲存 3 大核心技能缺一不可!

填資料拿《IBM 產品塑形秘笈

還能抽 Switch 遊戲機+健身環

 

點關鍵字看更多相關文章: