๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
Technology/Computer

chatGPT O3-mini์— ๋Œ€ํ•ด์„œ (openAI ์‚ฌ์ดํŠธ)

by re-moon 2025. 3. 23.

๐Ÿ” OpenAI ๋ชจ๋ธ ์‚ฌ์šฉ ํ•œ๋„ ๋ฐ ์ตœ์‹  ์ •๋ณด ๋ฒˆ์—ญ


๐Ÿ“Œ o1-mini ๋ฐ o3-mini ๋ชจ๋ธ ์‚ฌ์šฉ ํ•œ๋„ ๋ณ€๊ฒฝ
์ด์ œ o1-mini๋Š” ํ•˜๋ฃจ 50๊ฐœ ๋ฉ”์‹œ์ง€, o3-mini๋Š” ํ•˜๋ฃจ 150๊ฐœ ๋ฉ”์‹œ์ง€๊นŒ์ง€ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋˜ํ•œ, o3-mini๋Š” ๊ฒ€์ƒ‰ ๊ธฐ๋Šฅ(Search)์„ ํ™œ์šฉํ•˜์—ฌ ์ตœ์‹  ์ •๋ณด๋ฅผ ์ฐพ์•„ ๊ด€๋ จ ์›น ๋งํฌ๋ฅผ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ๋„๋ก ๊ฐœ์„ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
์ด ๊ฒ€์ƒ‰ ๊ธฐ๋Šฅ์€ ํ˜„์žฌ ์ดˆ๊ธฐ ํ”„๋กœํ† ํƒ€์ž… ๋‹จ๊ณ„์ด๋ฉฐ, ํ–ฅํ›„ OpenAI์˜ ๋ชจ๋“  Reasoning(์ถ”๋ก ) ๋ชจ๋ธ์— ํ†ตํ•ฉ๋  ์˜ˆ์ •์ž…๋‹ˆ๋‹ค.

๐Ÿ“Œ ๋ฌด๋ฃŒ ์‚ฌ์šฉ์ž๋„ o3-mini ์‚ฌ์šฉ ๊ฐ€๋Šฅ!
์˜ค๋Š˜๋ถ€ํ„ฐ ๋ฌด๋ฃŒ ์‚ฌ์šฉ์ž๋„ ChatGPT์—์„œ ‘Reason(์ถ”๋ก )’ ๋ชจ๋“œ๋ฅผ ์„ ํƒํ•˜๊ฑฐ๋‚˜ ์‘๋‹ต์„ ๋‹ค์‹œ ์ƒ์„ฑ(Regen) ํ•˜๋ฉด o3-mini ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์ด๋Š” OpenAI์˜ ์ถ”๋ก  ๋ชจ๋ธ์ด ์ฒ˜์Œ์œผ๋กœ ๋ฌด๋ฃŒ ์‚ฌ์šฉ์ž์—๊ฒŒ ์ œ๊ณต๋˜๋Š” ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค.


๐Ÿ”ฌ OpenAI o3-mini vs o1 ๋ชจ๋ธ ๋น„๊ต

๐Ÿ’ก OpenAI o1์€ ์ผ๋ฐ˜์ ์ธ ์ง€์‹ ์ถ”๋ก (General Knowledge Reasoning)์— ํŠนํ™”๋œ ๋ชจ๋ธ์ด์ง€๋งŒ,
o3-mini๋Š” ์ˆ˜ํ•™, ์ฝ”๋”ฉ, ๊ณผํ•™(์ด๋ฅธ๋ฐ” STEM ๋ถ„์•ผ)์— ์ตœ์ ํ™”๋œ ๊ธฐ์ˆ ์  ๋Œ€์•ˆ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ“Œ ChatGPT์—์„œ์˜ ํŠน์ง•:

  • o3-mini๋Š” ์ค‘๊ฐ„ ์ˆ˜์ค€์˜ ์ถ”๋ก (Medium Reasoning Effort) ์„ ์‚ฌ์šฉํ•˜์—ฌ ์†๋„์™€ ์ •ํ™•์„ฑ์˜ ๊ท ํ˜•์„ ๋งž์ถฅ๋‹ˆ๋‹ค.
  • ๋ชจ๋“  ์œ ๋ฃŒ ์‚ฌ์šฉ์ž๋Š” "o3-mini-high" ๋ชจ๋ธ์„ ์„ ํƒํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๋ณด๋‹ค ๋†’์€ ์ง€๋Šฅ์„ ์ œ๊ณตํ•˜์ง€๋งŒ ์‘๋‹ต ์ƒ์„ฑ ์‹œ๊ฐ„์ด ๋” ๊ฑธ๋ฆฝ๋‹ˆ๋‹ค.
  • ChatGPT Pro ์‚ฌ์šฉ์ž๋“ค์€ o3-mini ๋ฐ o3-mini-high๋ฅผ ๋ฌด์ œํ•œ์œผ๋กœ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๐Ÿš€ OpenAI o3-mini vs o1-mini ์„ฑ๋Šฅ ๋น„๊ต

"๋น ๋ฅด๊ณ  ๊ฐ•๋ ฅํ•˜๋ฉฐ, STEM ์ถ”๋ก ์— ์ตœ์ ํ™”๋จ!"
๐Ÿ“Œ o3-mini๋Š” o1-mini๋ณด๋‹ค ๋…ผ๋ฆฌ๋ ฅ๊ณผ ์ •๋ฐ€๋„๊ฐ€ ๋›ฐ์–ด๋‚จ

  • STEM(์ˆ˜ํ•™, ๊ธฐ์ˆ , ๊ณตํ•™, ๊ณผํ•™) ์ตœ์ ํ™” ๋ชจ๋ธ
  • ์ค‘๊ฐ„ ์ˆ˜์ค€์˜ ์ถ”๋ก (Medium Effort) ์„ ์‚ฌ์šฉํ•˜๋ฉด o1๊ณผ ๋™๊ธ‰์˜ ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉด์„œ ๋” ๋น ๋ฅธ ์‘๋‹ต์„ ์ œ๊ณต
  • ์ „๋ฌธ๊ฐ€ ํ‰๊ฐ€ ๊ฒฐ๊ณผ:
    • o3-mini์˜ ์‘๋‹ต์ด o1-mini๋ณด๋‹ค 56% ๋” ์„ ํ˜ธ๋จ
    • ์‹ค์ œ ์–ด๋ ค์šด ์งˆ๋ฌธ์—์„œ ์ฃผ์š” ์˜ค๋ฅ˜(Major Errors)๊ฐ€ 39% ๊ฐ์†Œํ•จ

๐Ÿ“Š AI ๋ชจ๋ธ๋ณ„ ์ˆ˜ํ•™ & ๊ณผํ•™ ์„ฑ๋Šฅ ํ‰๊ฐ€

๐Ÿ“Œ AIME 2024(๊ฒฝ์‹œ๋Œ€ํšŒ ์ˆ˜ํ•™ ๋ฌธ์ œ ์ •ํ™•๋„ ๋น„๊ต)

  • OpenAI์˜ ์ตœ์‹  AI ๋ชจ๋ธ๋“ค์€ AIME 2024 ์ˆ˜ํ•™ ๋ฌธ์ œ ํ•ด๊ฒฐ ์„ฑ๋Šฅ์„ ๋น„๊ต ํ‰๊ฐ€๋ฐ›์Œ.
  • o3-mini-high๊ฐ€ ์ตœ๊ณ  ์ •ํ™•๋„(83.6%)๋ฅผ ๊ธฐ๋กํ•˜๋ฉฐ ๊ฐ€์žฅ ํฐ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ๋ณด์ž„.
  • ์˜ค๋ž˜๋œ ๋ชจ๋ธ๋“ค์€ ์„ฑ๋Šฅ์ด ๋‚ฎ์•˜์ง€๋งŒ(ํšŒ์ƒ‰), ์ƒˆ๋กœ์šด ๋ชจ๋ธ๋“ค์€ ์„ฑ๋Šฅ์ด ํฌ๊ฒŒ ํ–ฅ์ƒ๋จ(๋…ธ๋ž€์ƒ‰).

 

 

 

 


๐Ÿ“Š ๋ฐ•์‚ฌ ์ˆ˜์ค€ ๊ณผํ•™ ์งˆ๋ฌธ(GPQA Diamond) ์ •ํ™•๋„ ๋น„๊ต

  • o3-mini-high๋Š” ๋ฐ•์‚ฌ ์ˆ˜์ค€์˜ ์ƒ๋ฌผํ•™, ํ™”ํ•™, ๋ฌผ๋ฆฌํ•™ ๋ฌธ์ œ์—์„œ 77.0% ์ •ํ™•๋„๋ฅผ ๋‹ฌ์„ฑํ•˜๋ฉฐ, ์ด์ „ ๋ชจ๋ธ๋ณด๋‹ค ํฌ๊ฒŒ ํ–ฅ์ƒ๋จ.
  • ๊ธฐ์กด ๋ชจ๋ธ๋“ค๋ณด๋‹ค ๋” ๋†’์€ ๋…ผ๋ฆฌ์  ์ •๋ฐ€๋„๋ฅผ ์ œ๊ณตํ•˜๋ฉฐ, ํŠนํžˆ ์–ด๋ ค์šด ๋ฌธ์ œ์—์„œ๋„ ๊ฐ•๋ ฅํ•œ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜ํ•จ.

 

 

 

 

 


 

๐Ÿ“Œ ๊ฒฐ๋ก 

โœ… o3-mini๋Š” ๊ธฐ์กด OpenAI o1-mini๋ณด๋‹ค ๊ฐ•๋ ฅํ•˜๋ฉฐ, STEM(์ˆ˜ํ•™, ๊ณผํ•™, ๊ณตํ•™, ์ฝ”๋”ฉ)์— ์ตœ์ ํ™”๋จ
โœ… o3-mini์˜ "High" ๋ฒ„์ „์€ ๋”์šฑ ๊ฐ•๋ ฅํ•œ ๋…ผ๋ฆฌ๋ ฅ๊ณผ ์ •ํ™•๋„๋ฅผ ์ œ๊ณตํ•˜๋ฉฐ, ์ˆ˜ํ•™ ๋ฐ ๊ณผํ•™ ์„ฑ๋Šฅ์ด ๋Œ€ํญ ํ–ฅ์ƒ๋จ
โœ… ๋ฌด๋ฃŒ ์‚ฌ์šฉ์ž๋„ ์ฒ˜์Œ์œผ๋กœ "Reason(์ถ”๋ก )" ๋ชจ๋“œ๋ฅผ ํ†ตํ•ด ์ผ๋ถ€ o3-mini ๊ธฐ๋Šฅ์„ ์ฒดํ—˜ ๊ฐ€๋Šฅ
โœ… o3-mini๋Š” ์ด์ œ ๊ฒ€์ƒ‰ ๊ธฐ๋Šฅ(Search)์„ ํ™œ์šฉํ•˜์—ฌ ์‹ค์‹œ๊ฐ„ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ์Œ

์ด์ œ OpenAI์˜ ์ตœ์‹  ๋ชจ๋ธ ์ค‘ ํ•˜๋‚˜์ธ o3-mini๋Š” ๋น ๋ฅด๊ณ  ๊ฐ•๋ ฅํ•œ STEM ์ถ”๋ก  ๋ชจ๋ธ๋กœ ๋ฐœ์ „ํ•˜๊ณ  ์žˆ์œผ๋ฉฐ,
๋ฌด๋ฃŒ ์‚ฌ์šฉ์ž๋„ Reason ๋ชจ๋“œ๋ฅผ ํ†ตํ•ด ์ผ๋ถ€ ๊ธฐ๋Šฅ์„ ์ฒดํ—˜ํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐํšŒ๋ฅผ ์ œ๊ณต๋ฐ›๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๐Ÿš€