從文字到圖像:DALL·E 3 的完整教學與介紹
日期:2024-11-13
DALL·E 3 在語意理解和圖像細節上有大幅提升,是設計師、創作者及愛好者的理想工具。本教學將帶你了解 DALL·E 3 的功能、使用方法、收費模式,以及注意事項。
什麼是 DALL·E 3?
DALL·E 3 是生成式 AI 技術的突破,它能透過分析文字描述,精確生成滿足需求的圖像。該模型於 2023 年 9 月推出,目前也可透過 Microsoft 的 Bing Image Creator 免費使用。
核心技術基礎
Transformer 架構
DALL·E 3 繼續基於 Transformer,這是一種深度學習模型,擅長處理序列數據(例如文字和圖像編碼)。
Transformer 就像一個非常聰明的工具,能理解我們寫的文字,並把這些文字「轉換」成可以用來生成圖像的內容。它的設計讓它特別擅長處理很長的文字,比如你描述圖像時加入很多細節,它也能理解。
CLIP 整合
與 OpenAI 的 CLIP 模型緊密結合,CLIP 用於理解和匹配文字與圖像之間的關聯性,提升生成結果的語義一致性。
CLIP 是 DALL·E 的一個「搭檔」,專門幫助模型理解文字和圖像之間的關係。比如,你寫「紅色的貓坐在樹下」,CLIP 負責幫助模型確保生成的圖像中有「紅色貓」和「樹下」這些元素,避免生成一些偏差很大的結果。
換句話說,DALL·E 3 是基於這些技術來讀懂你的描述,然後把這些描述「畫」出來的!
如何使用 DALL·E 3
方法一:透過 ChatGPT Plus
訂閱 ChatGPT Plus
前往 OpenAI 官網(openai.com),訂閱每月 20 美元的 ChatGPT Plus 計劃。登入 ChatGPT
使用您的帳戶登入 ChatGPT,選擇含有 DALL·E 3 的版本。輸入文字描述
在對話框中輸入您希望生成的圖像描述。
方法二:透過 Bing Image Creator 免費使用
訪問 Bing Image Creator
前往 Bing Image Creator。輸入文字描述
在輸入框中描述您希望生成的圖像內容。點擊生成
按下生成按鈕,等待 DALL·E 3 生成圖像。保存圖像
圖像生成完成後,您可以免費下載使用。
DALL·E 3 的收費模式
ChatGPT Plus 訂閱:
每月 20 美元,可獲得完整的 DALL·E 3 生成功能,以及 ChatGPT 的其他增強功能。
免費使用選項:
透過 Bing Image Creator,所有用戶均可免費使用 DALL·E 3,但有次數限制。
成果
Prompt:日系漫畫風格的男生
Prompt:韓系漫畫風格男生
Prompt:日系漫畫風格的女生
Prompt:韓系漫畫風格的女生
Prompt:幫我生成日本卡通風格可愛人物
Prompt:幫我生成南韓卡通風格可愛人物
Prompt:幫我生成台灣卡通風格可愛人物
結語
不得不說DALL·E 3生出來的圖片真的質量很高,
而且我這些生出來的圖片還沒有使用反向提示詞
,就有這個效果,真的太厲害了!!
喜歡 好崴寶 Weibert Weiberson 的文章嗎?在這裡留下你的評論!本留言區支援 Markdown 語法。