Gemini - Introduction

前言

今天參加了 Google Developer Groups DevFest Taipei 2023，
也剛好因為本周四 12/14 Google 發表了 Gemini 模型，
今天非常多場的講師都現場改了主題，從原本要講 PaLM，臨時兩天改簡報改成講 Gemini，講師們都說他們快死了，我覺得這景象很有趣 XD

今天總共聽了 5 們議程，分別是：

	議程名稱	講師
1	Future-Proofing Enterprise Conversations: Integrating NeMo-GuardRails & PaLM2（原主題名稱，後來開講的時候有改）	Jimmy Liao
2	多模態模型 - Gemini	Jerry Wu
3	Advanced Knowledge Management with Generative AI	Michael Chi
4	整合 Vertex AI 與開源工具快速打造 AI 產品原型	tjwei
5	使用 Google AI Studio 與 Gemini 快速打造 Generative AI 原型設計	Will 保哥

每位都是大神，膜拜 <(_ _)>

Introduction

Gemini 是一種多模態 LLM，可以用文本、圖像、影片、音樂、程式碼等方式當 prompt
有 Ultra、Pro、Nano 版本：
- Ultra：高複雜度任務，準確率較高
- Pro：成本最佳化、低延遲
- Nano：邊緣裝置
可以透過 Google AI Studio 試用 Generative AI Gemini API
- 目前完全免費
- 企業級可透過 Google Cloud console 的 Vertext AI Studio 體驗 Vertex AI Gemini API

Google AI Studio - Gemini

在左側欄位裡，點 “Create new” 可以選擇模式

1. Freeform Prompt

1. 進入這個畫面後，可以自由輸入想要詢問的問句，輸入完後點及左下角的 Run 按鈕

藍字是 Gemini 的回覆

1-1. Temperature 是設定 Gemini 回覆的「創意程度」，越接近 1 越有創意

2. 若想要給予 image 讓 Gemini 分析，可以切換右方的 model 至 “Gemini Pro Vision”

2-1. 我的 Prompt

2-2. Gemini 的回覆

體感 Gemini 的回覆速度比 GPT 快很多，且~~廢話少很多~~比較精簡扼要

3. Test input

3-1. 框起想詢問的 prompt 語句裡的關鍵字，點擊 “Test input” 會出現下方的框框，便可一次輸入多個 input

在要問類似內容時很好用，而且很方便比較 XDD

3-2. 按下 Run 之後就可以一次收割 Gemini 的回覆了

2 Structured Prompt

可以告訴 Gemini 你的 input 形式如何，output 形式如何，然後給予 test input prompt，讓 Gemini 回覆你類似形式

按下 Run 後獲得回覆

3 Chat Prompt

左邊可以教他你的 user input prompt 形式範例，也可以給 Gemini 如何回覆你的範例（也可以讓他自動生成），可以多給幾次不同範例

右邊輸入你想跟他聊天的 prompt，而 Gemini 會用你教他的方式回覆

這個功能有點像聊天機器人，但多了一個，你可以教他怎麼聊天的過程 XD

4 Tuned model

大家應該都知道 Fine-Tune 模型很貴吧 XD
by Will 保哥

Fine-Tune 過 OpenAI model 的我默默流下汗水，怕爆

心得

murmur

今天去 DevFest 受益良多，感覺跟上了~~時代的潮流~~最新的技術，回家馬上開始亂玩 XD

其實 DevFest 議程有非常多類型的主題，只是我主要有興趣在 ML/AI 這塊，又對最新熱騰騰的 Gemini 特別感興趣，所以主要參加了 5 場都是 Gemini 的
5 場都是不太一樣的面向，每場都給我不一樣的體悟

希望對之後碩士論文的啟發有幫助，~~其實是冒著期末考跟專題發表爆炸的風險跑出來的，而且今天好冷 QQ~~

Reference

今天聽的議程
- 多模態模型 - Gemini by Jerry Wu
- 使用 Google AI Studio 與 Gemini 快速打造 Generative AI 原型設計 by Will 保哥