MTR 出咗一個 web3 比賽俾參賽者使用 MTR 自家 Generative AI (Stable Diffusion) 出未來 AI 列車圖!

https://web3.mtr.com.hk/generative-ai

作為一個 90 後聽到「未來列車」一詞,最強烈嘅想像就係災難電影「屍殺列車」,本來以為 MTR 會擋哂所有血腥暴力恐佈之類嘅 Generation,就嘗試下寫 Prompt 試下有冇可能出到我想要嘅嘢。

屍殺列車之旅

一開始冇頭緒當然試下空白 prompt,睇下有冇嘢出。

(whitespace)

(whitespace)

prompt 1

1

點知空白 prompt 都會出到一架正常樣嘅列車同埋人,估計係用咗 Stable Diffusion (SD) 嘅 inpainting 去做呢次比賽,試下加入一啲恐佈場景元素以及一啲喺 SD 常用嘅 Prompt:

horible, horrific, scary, sun shine, sparking, photo realistic, 
4D, multiverse, dirty, untidy

(whitespace)

prompt 2

2

好似真係陰森咗小小,試下入血 blood 元素:

horible, horrific, scary, blood, sun shine, sparking, 
photo realistic, 4D, multiverse, dirty, untidy

(whitespace)

prompt 3

3

見到背景成功出現血跡,感覺列車後的背景在 Stable Diffusion 比較可以自由控制,試下加入月亮 moon 元素及試下有冇辦法出 bloody logo

horrific, scary, blood logo, bloody moon background, 
sparking, photo realistic, 4D, multiverse, dirty, untidy

bloody logo

prompt 4

4

見到背景成功轉成月亮,試下加入喪屍元素 zombie

horrific, scary, blood logo, bloody zombie background, 
sparking, photo realistic, 4D, multiverse, dirty, untidy

bloody logo

prompt 5

5

見到地面多咗一啲血跡,試下有冇可能出到一啲屍體係地下,加入dead body on the ground 同埋 empty skull 落件衫度 :

horrific, scary, blood logo, bloody zombie background, 
sparking, photo realistic, 4D, multiverse, dirty, untidy, dead body on the ground

bloody t-shirt with empty skull 

prompt 6

嘩,誤打誤撞發現原來車頭都可以有咁大發揮空間,試下直接變做骷髏頭 skull,唔知關唔關人物個 Prompt 事,移除 empty skull

horrific, scary, blood logo, bloody zombie background, 
sparking, photo realistic, 4D, multiverse, dirty, untidy, dead skull

bloody logo

prompt 7,8,9

7

今次多咗對眼,用同一個 Prompt 再 Generate 多幾次:

8
9

GLT 討論社群分享緊,有朋友問:

改一改試下轉做將骷髏頭轉做 monkey , animal

horrific, scary, blood logo, bloody zombie background, 
sparking, photo realistic, 4D, multiverse, dirty, untidy, 
monkey, animal

bloody t-shirt with empty skull 

prompt 10

10

結果真係出咗猿人樣嘅列車!成個效果好似一個食人列車,夠哂「屍殺」味道!

「元」於你想象嘅未來港鐵又係點嘅樣呢?

總結

要發展一個 Responsible GenAI (Generative AI) Tool 其實一啲都唔容易,始終 LLM (Large Language Model) 使用上龐大數據去堆砌出黎,因為數據量太多太大,要寫一啲規距去「控制及防止」一啲 Prompt 去觸發一啲不想出現嘅 Output 其實好困難。

正如今次 MTR 出嘅呢個 Stable Diffusion 工具,我想 Generate 一張「元」於我想像嘅屍殺列車風格嘅圖片,圖片唔多唔少都必定會含有血腥成份,好簡單咁諗:

封殺所有血腥成份嘅 Generation 咪得囉!

但點封?

從 Prompt 及關鍵字入手一定沒完沒了,好容易就會被用戶「Jailbreak」,要諗到 AI 會將邊啲字眼產生 Correlation 極級困難。

從 Image Source 入手重新 Train 過一個模型,需要有大量 Computing 資源,雖時極長,最後還會產生大量碳排放。

Work around 的話,一個簡單但不 Efficient 嘅方法就係產出每張圖片之後,加入 AI 檢查圖片是否含有血腥、暴力或色情元素⋯⋯

ChatGPT、Bing AI、Google Bard 後面其實有大量不同專家去幫手做一個 「Responsible AI」,減少將人類的陰暗面暴露在 GenAI 的 Output 之中,反觀過來:

這可能就是人類自我限制的「極限」。