Gemini - Introduction

前言
今天參加了 Google Developer Groups DevFest Taipei 2023,
也剛好因為本周四 12/14 Google 發表了 Gemini 模型,
今天非常多場的講師都現場改了主題,從原本要講 PaLM,臨時兩天改簡報改成講 Gemini,講師們都說他們快死了,我覺得這景象很有趣 XD
今天總共聽了 5 們議程,分別是:
議程名稱 | 講師 | |
---|---|---|
1 | Future-Proofing Enterprise Conversations: Integrating NeMo-GuardRails & PaLM2(原主題名稱,後來開講的時候有改) | Jimmy Liao |
2 | 多模態模型 - Gemini | Jerry Wu |
3 | Advanced Knowledge Management with Generative AI | Michael Chi |
4 | 整合 Vertex AI 與開源工具快速打造 AI 產品原型 | tjwei |
5 | 使用 Google AI Studio 與 Gemini 快速打造 Generative AI 原型設計 | Will 保哥 |
每位都是大神,膜拜 <(_ _)>
Introduction
- Gemini 是一種多模態 LLM,可以用文本、圖像、影片、音樂、程式碼等方式當 prompt
- 有 Ultra、Pro、Nano 版本:
- Ultra:高複雜度任務,準確率較高
- Pro:成本最佳化、低延遲
- Nano:邊緣裝置
- 可以透過 Google AI Studio 試用 Generative AI Gemini API
- 目前完全免費
- 企業級可透過 Google Cloud console 的 Vertext AI Studio 體驗 Vertex AI Gemini API
Google AI Studio - Gemini
在左側欄位裡,點 “Create new” 可以選擇模式
1. Freeform Prompt
1. 進入這個畫面後,可以自由輸入想要詢問的問句,輸入完後點及左下角的 Run 按鈕
藍字是 Gemini 的回覆
1-1. Temperature 是設定 Gemini 回覆的 「創意程度」,越接近 1 越有創意

2. 若想要給予 image 讓 Gemini 分析,可以切換右方的 model 至 “Gemini Pro Vision”

2-1. 我的 Prompt

2-2. Gemini 的回覆
體感 Gemini 的回覆速度比 GPT 快很多,且
廢話少很多比較精簡扼要

3. Test input
3-1. 框起想詢問的 prompt 語句裡的關鍵字,點擊 “Test input” 會出現下方的框框,便可一次輸入多個 input
在要問類似內容時很好用,而且很方便比較 XDD

3-2. 按下 Run 之後就可以一次收割 Gemini 的回覆了

2 Structured Prompt
可以告訴 Gemini 你的 input 形式如何,output 形式如何,然後給予 test input prompt,讓 Gemini 回覆你類似形式

按下 Run 後獲得回覆

3 Chat Prompt
左邊可以教他你的 user input prompt 形式範例,也可以給 Gemini 如何回覆你的範例(也可以讓他自動生成),可以多給幾次不同範例
右邊輸入你想跟他聊天的 prompt,而 Gemini 會用你教他的方式回覆
這個功能有點像聊天機器人,但多了一個,你可以教他怎麼聊天的過程 XD

4 Tuned model
大家應該都知道 Fine-Tune 模型很貴吧 XD
by Will 保哥
Fine-Tune 過 OpenAI model 的我默默流下汗水,怕爆
心得
murmur
今天去 DevFest 受益良多,感覺跟上了時代的潮流最新的技術,回家馬上開始亂玩 XD
其實 DevFest 議程有非常多類型的主題,只是我主要有興趣在 ML/AI 這塊,又對最新熱騰騰的 Gemini 特別感興趣,所以主要參加了 5 場都是 Gemini 的
5 場都是不太一樣的面向,每場都給我不一樣的體悟
希望對之後碩士論文的啟發有幫助,其實是冒著期末考跟專題發表爆炸的風險跑出來的,而且今天好冷 QQ
Reference
- 今天聽的議程
- 多模態模型 - Gemini by Jerry Wu
- 使用 Google AI Studio 與 Gemini 快速打造 Generative AI 原型設計 by Will 保哥