쳇봇

생성형 AI 학습을 위한 작가의 창의적인 한국어 Prompt 생성 #5(업데이트 진행 중)

coding art 2024. 7. 1. 14:39
728x90

1. 16개 Category

주어진 Prompt에 대한 2개의 Response 에 대해 채점 규칙을 적용하는 작업과 비교해 아예 학습용 Prompt를 새로이 생성하는 작업은 창의성이 있는 작가(Creative Writer)로서의 능력이 요구된다. 이는 Outlier.AI 인터뷰 과정의 첫번째 질문 사항이기도 하다.

하지만 Outlier.AI 에서 요구하는 Prompt 생성작업은 나름대로의 지침들이 있다. 

생성해야 할 Prompt의 주제 갈래는 구글을 중심으로 크게 대분류인 16개의 Category에 대해 소분류인 Subcategory들로 구성된다. 즉 우리 인간이 거의 매일 주고받는 대화나 정보의 범위를 그렇게 잡는다는 것이다. 하지만 1개의 Category에 대한 소분류 Subcategory의 수도 만만치 않아 특정 소수의 주제에만 집중하는 블로그 작가로 지내온 필자는 처음에 실제로 쫄아버렸지 않았나 하는 기억이 남아있다.

 

일단 전체 16개 Category를 살펴보자.

 

1. Factual Questions                                            2. Procedural Questions                    3. Language assistance

4. Writing & content creation                                       5. Dialogue                      6. Recommendations / Brainstorming

7. Personal Growth and Development   8. Social interaction and communication   9. Mathematical Calculation

10. Mathematical Reasoning                          11. Commonsense Reasoning                12. Logic/problem solving

13. Social and Emotional Reasoning               14. Consequence evaluation                 15. Scientific Reasoning

16. Case-Based Reasoning

 

2. Subcategory의 수

1번 Factual Questions 에 대한 세부 카테고리를 살펴보자.

① Historical events & figures

② Scientific concepts and explanations

③ Geographical information

⓸ Cultural & social topics

⓹ Technical information

 

제한 시간이 30분인 ① Historical events & figures 작업 사례로서  필자가 "한글은 언제, 누가, 어떤 목적으로 만들었나요?"라는 Prompt를 작성하고 채점 처리하였다.

처음에는 간단한 Prompt 를 쉽게 생성할 수 있으나 유사한 작업이 많이 되풀이 된다면 해당 Subcategory 사례를 미리 준비해야 하는 부담도 있을 수 있다. 

 

아래에 필자가 준비한 예제들을 살펴보자. 이러한 Prompt는 세대와 무관하게 한국인에게는 보편적인 주제들이다.

이중 첫번째와 두번째는 실제 과제에 사용하였다.

조선시대의 정교한 물시계는 누가 처음 만들었나요?

한국에서 처음 도입된 철도 구간은 어디며 철도 폭은 협궤인지 광궤인지 및 누구의 지원에 의해서 건설되었나요?

조선시대 역사를 정확하게 기록한 책은 무엇이며 조정의 어느 부서가 주체가 되어 작성 발행했는가?

조선시대 중앙 조정의 구조와 각 부서의 역할을 간단하게 설명해주세요.

조선시대에 과거제도를 통해 어떤 분야에서 사람을 뽑았는지 그리고 어떤 사람들이 지원할 수 있는지 설명해주세요.

 

그런데 Outlier에서 가장 경계하는 점은 작가가 아이디어가 없다고 해서 Gemni 나 ChatGPT 에게 물어봐서 얻어낸 Prompt 를 적어내는 경우 표절이 소프트웨어에 의해 체크되므로 당장 적발되든지 나중에 적발되므로  표절은 극히 조심해야 합니다.

 

필자가 풀었던 사례를 하나 살펴보자. 카테고리가 Writing & content creation 이고 서브카테고리가 Legal writing 즉 법적인 서류이다. 법적인 서류하면 떠오르는 아이디어가 대단히 제한되지만 살면서 부동산 월세, 전세, 매매 계약은 한번쯤은 겪어본 경험이 있을 것이다.

 

한국어로 Prompt를 작성한다.

Complexity 즉 제한조건 수는 Meadium 으로 2 ~ 4 이므로 꽉 채워서 4개로 처리한다.

Complexity 수 체크와 이행 여부는 Instruction Following  여부의 중요한 판단 근거이다.

 

작가가 생성한 Prompt를 실행하면 다음과 같이 2개의 Response 가 얻어지며, 채점항목 별로 채점을 실시한다.

2개를 읽어 보고 각각을 채점 한 후에 좋은 것을 택한다. 여기서는 Response B 가 선택되었다.

 

Response 평가는 타겟언어 사용 여부, Likert Justification 작성, Accuracy(Truthfulness에 해당), Fluency(Writing Quality에 해당), Localized Response, Formatting, Rating Justification 이다.

 

Likert Justification 작성에서 Response A 는 요구사항이 단연 한글인데 응답 결과에 한글과 영어가 섞여 Bad으로 평가.

(Likert Justification은 1. 매우 좋다 2.좋다, ..., 4. 나쁘다 5. 매우 나쁘다 식으로 답하는 설문조사 방식을 뜻한다.)

Response B는 6가지를 제시한 후 중요도에 따라 3가지만 요구대로 선택하였다.--> 내용을 보면 타겟 언어 사용 준수 여부와 Instruction Following  체크 여부를 작성하였다.

Fluency는 Writing Quality 처럼 철자 및 문법 오류를 뜻하며, Response 텍스트에 한국어가 아닌 영어 포함 타 외국어가 섞여 있는 경우다. 30%를 기준으로 major issues 와 minor issues 를 구분한다. 특히 한국어에 일본어 쪼가리가 일부분 들어 있느 경우 가 자주 발생한다.

( 그외에도 여러 단에 걸쳐 prompt 문의가 계속되는 multi-turn prompts 의 경우 prompt 의 주제가 범위를 벗어난 엉뚱한 응답을 주어서는 안된다. 이를 tone 즉 문장의 흐름 또는 기조라 할 수 있는데, 넓은 의미에서 이를 Fluency 라한다)

Format은 넘버링이나 글머리표를 사용하여 잘 정리하는 것을 뜻한다.

Localized Justification은 각 나라별 완전히 서로 다를 수밖에 없는 속담 사용 여부이다. 없으면 No Issues 를 체크한다.

마지막으로 앞서의 평가항목들을 종합하여 Response B 가 A 보다 낳다는 Rating Justification 을 작성한다. 

원문이 오른쪽 편에 치우친 관계로 3개로 잘라서 붙였다.

 

이와 같은 Prompt  생성 문제 유형이 필자에게는 가장 어려웠다. 그 이유는 필자가 창의적인 정통파 작가가 아닌 짝퉁 작가가 아니었나 하는 점이다.

가장 힘든 점은 30분 처리 시간제한인데 아이디어가 잘 생각나지 않으므로 인공지능  Gemini 에게 카테고리와 서브카테고리를 주고 유사한 Prompt 생성 문제에 대한 샘플 답을 보고 난 후 표절이 아닌 모방 생성하는 법을 택했다. 빠른 한글 타이핑이 필수적이다.

 

하지만 이때 다루었던 모든 문제들은 100% 피드백 되는 것으로 보아 실전 과제가 아닌 프리랜서 참여자의 능력을 최대한 발휘게 하는 훈련용 연습과제인 듯하다.

 

아래에 실제 풀어보았으며 피드백되었던 과제의 Category 및 Subcategory 별로 창의적으로 직접 작성했던 사례들을 자료로 첨부한다. 이 과제들을 Gemini 와 같은 인공지능에게 실행시켜보면 어떤 문제인지 대략 짐작이 갈 것이다. 툭히 이중에서 본인이 익숙치 않은 문제들 10 여개를 대상으로 인공지능에게 실행시켜 공부하는 것이 좋을 듯하다. 

 

주의할 점은 제한 시간 30분이지만 시간을 초과하면 한번 더 기회를 주므로 1시간이 걸리드라도 제대로 풀어 보는 것이 좋다. 어차피 이러한 훈련과제는 시간당 9.5불이기 때문에 굳이 시급에 연연해할 필요 없이 느긋하게 공부하는 자세로 통과할 것을 추천하는 바이다.

 

골치 아픈 수학 문제도 첨부되어 있는데 이는 생성형 AI 의 학습 목표가 대학교 1학년 교양과정 수준이므로, 그에 맞는 수학, 화학 , 물리학 문제가 출제 될 수 있음에 유의하자. 

 

Prompt 생성 Category, Subcategory, Constraints
처음 한글을 배우기 시작하는 미국인이 철자법, 단어, 문장 구조, 문법 및 읽기 분야에서 항상 조심해야 하는 점들을 알려주세요. Main Category: Language assistance
Subcategory: Grammar, spelling, & vocabulary

Requirements:
Write prompt in Korean

Complexity: High meaning you should include 5+ constraints
사춘기에 접어든 남자 중학생이 겪게 되는 급격한 감정 변화에 대해서 부모가 어떻게 지원해야 하는가  중요한 내용을 3가지로 요약해 자문해 주세요. Main Category: Personal Growth and Development
Subcategory: Emotional support

Requirements:
Write prompt in Korean

Complexity: Medium meaning you should include 2-4 constraints
게임을 좋아하는 대학생 친구들 모임에서 2명 이상이 스마트폰으로 할 수 있는 게임으로 배우는 데 걸리는 시간이 30분 이내이고, 지불해야 할 비용이 없고, 대단히 재미있는 게임을 서로 소개하는 두 사람의 대화를 12줄 이내로 작성해줘. Main Category: Dialogue
Subcategory: Games: Social & party

Requirements:
Write prompt in Korean

Complexity: High meaning you should include 5+ constraints

세금 납부 후 월급이 500만원인 남편과 부인으로 이루어진 2인 가구의 재무계획을 15줄 이내로 간단히 세워주세요. Main Category: Procedural Questions
Subcategory: Finance & budgeting

Requirements:
Write prompt in Korean

Complexity: Medium meaning you should include 2-4 constraints

 

원룸 계약서에 반드시 들어 가야할 내용을 1페이지로 작성하고, 내용 중에서 계약자가 반드시 확인해야 될 가장 중요한 정보를 3가지만 지적해주세요. Main Category: Writing & content creation
Subcategory: Legal writing

Requirements:
Write prompt in Korean
Complexity: Medium meaning you should include 2-4 constraints
소셜미디어 카톡에서 스포츠 용품 사용자들에게 어필하기 위한 창의적인 광고문 작성법을 3가지로 요약해주세요. Main Category: Writing & content creation
Subcategory: Creative writing: Social media posts

Requirements:
Write prompt in Korean
Complexity: High meaning you should include 5+ constraints
뉴턴의 1법칙, 2법칙 및 3법칙을 간단히 설명하고 차이점을 1가지씩 설명하여라. Main Category: Factual Questions
Subcategory: Scientific concepts and explanations

Requirements:
Write prompt in Korean
Complexity: Low meaning you should include 0-1 constraints

골든 리트리버 반려견과 시바이누를 키우는 젊은 대학생들간에 오갈 수 있는 대화를 10줄 이내로 작성해주세요.

Main Category: Dialogue
Subcategory: Chit-Chat

Requirements:
Write prompt in Korean
Complexity: Medium meaning you should include 2-4 constraints

 

 

직각좌표계(x, y)상에서 반경이 1인 원을 작도하고 x축으로부터 임의 각도 d radian에 해당하는 반지름을 그려서 3점 (0, 0), (x,0), (x,y)이 이루는 삼각형을 사용하여 다음의 관계식이 성립함을 증명하여라. Main Category: Mathematical Calculation
Subcategory: Geometry & trigonometry

Requirements:
Write the prompt in Korean
Complexity: Low meaning you should include 0-1 constraints
함수 ( y = f(x) = x )를 구간 ((0, 1))에서 정적분하여라. Main Category: Mathematical Calculation
Subcategory: Calculus & advanced math
Requirements:


Write the prompt in Korean
Complexity: Low meaning you should include 0-1 constraints
문제해결을 위해 장단점 식별 기법과 Fishbone 기법 적용을 비교해주세요. Main Category: Logic / problem solving
Subcategory: Identifying pros & cons

Requirements:

Write the prompt in Korean
Complexity: Low meaning you should include 0-1 constraints

Root Cause 기법 중 FMEA 기법에 대해서 5가지로 요약 설명해주세요. Main Category: Logic / problem solving
Subcategory: Identifying root causes & issues

Requirements:
Write the prompt in Korean
Complexity: Low meaning you should include 0-1 constraints

 

2의 제곱근이 유리수가 아님을 증명해주세요. Main Category: Mathematical Reasoning
Subcategory: Theorem proving (e.g. proofs)

Requirements:
Write the prompt in Korean
Complexity: Low meaning you should include 0-1 constraints
문제의 근본 원인을 찾아 분석하는 기법 중 5 Whys 와 Fishbone Diagram 기법의 장단점을 비교하여 4가지 이내에서 설명해주세요. Main Category: Logic / problem solving
Subcategory: Identifying root causes & issues

Requirements:

Write the prompt in Korean
Complexity: Low meaning you should include 0-1 constraints
천장에 설치된 스프링 상수가 k인 스프링이 수직방향으로 중량이 W인 물체와 연결되어 있을때 물체를 아래로 당겼다가 놓으면 일어나는 운동을 모델링해주세요. Main Category: Mathematical Reasoning
Subcategory: Mathematical model building

Requirements:
Write the prompt in Korean
Complexity: Low meaning you should include 0-1 constraints

n이 자연수일때 다음 등식이 성립함을 수학적 귀납법을 사용하여 증명하여라.
1^2+2^2+3^2+...+n^2=n(n+1)(2n+1)/6
Main Category: Logic / problem solving
Subcategory: Inductive reasoning

Requirements:
Write the prompt in Korean
Complexity: Low meaning you should include 0-1 constraints

 

유클리드 기하학에서 평행성 공리를 어떻게 증명하는지 설명해주세요. Main Category: Mathematical Reasoning
Subcategory: Theorem proving (e.g. proofs)

Requirements:
Write the prompt in Korean
Complexity: Low meaning you should include 0-1 constraints
금속으로 만들어진 라디에이터 핀(Fin)에서의 냉각 열전달 모델에 대해서 정성적으로 분석 후 방정식을 수립하고 푸는 방법을 설명해주세요. Main Category: Mathematical Reasoning
Subcategory: Mathematical model building

Requirements:
Write the prompt in Korean
Complexity: Medium meaning you should include 2-4 constraints
금속으로 만들어진 라디에이터 핀(Fin)에서의 냉각 열전달 모델에 대해서 정성적으로 분석 후 방정식을 수립하고 푸는 방법을 설명해주세요. Main Category: Mathematical Reasoning
Subcategory: Mathematical model building

Requirements:
Write the prompt in Korean
Complexity: Medium meaning you should include 2-4 constraints

하늘을 날 수 있는 5가지 새들의 예를 들어라. 이 새들이 조류인가 확인하여라. 그렇다면 조류는 모두 다 하늘을 날 수 있는지 분석하여 답을 제시하여라. Main Category: Logic / problem solving
Subcategory: Inductive reasoning

Requirements:
Write the prompt in Korean
Complexity: High meaning you should include 5+ constraints

 

 

그 이외에도 기억나는 Prompt로는 음식 레시피에 관한 것으로 요리과정, 식재료에 대한 설명 및 칼로리 정보에 관한 응답을 분석하는 문항들이 꽤 많았지만 제대로 된 답변을 못했던 것 같다. 식재료 구성 상에서 속임수들이 있었으며, 부정확한 영양 정보 문제도 거론되었으나 거의 다 속았던 기억이 나는데, 그 해결책은 구글링이나 예리한 검색에 의존할 수 밖에 없다.

 

※  인터뷰 1번 문항에서 나온 적이 있는 기출문제로서 "당신의 이력이나 경험이 Outlier AI에서 원하는  창의성이 있는 작가(Creative Writer)로서 요구되는 능력과 어떤 관계인지 300자 내외로 작성 입력하세요."와 같은 문제에 직면할 경우

다음과 같이 Gemini에 Prompt를 입력하자.

 

"나의 참조 영문 이력서를 읽고 생성형 AI 학습을 위한 창의성 있는 한국어 작가로서 가능성을 500자 내외로 작성해줘.

(여기서 참조된 이력서는 Linkedin Profile에 오픈된 이력서 학력 및 경력 내용 선택 사용)

참조 영문 이력서:

Academy

‘79년 Seoul National University, Mech Eng

‘81년 KAIST Graduate School, Mech Eng

‘86∼’91 North Carolina State University Mech Eng, Ph.D ‘81∼’86 KIST, Division Of Mechanical Engineering,

 

Researcher

‘92∼’99 Samsung Aerospace & KAI, supersonic jet trainer T-50 Development, Stress Team Leader 2000∼2022 Professor, Yongin Arts & Science University 2018∼2024 Writer of the Blog: Machine Learning, AI, Arduino Coding https://ejleep1.tistory.com/ Published Stuffs 1. Tensorflow∙OpenCV Machine Learning for the Python Beginners, 2018.12,ㆍ Kyobo Purple.

2. “Stress Distribution in an Edge-Stiffened Semi-infinite Elastic Plate Containing a Circular Hole,” December 1992, Vol.59, Journal of Applied Mechanics.

3. “Load Transfer from a Multiply-Connected Plane Anisotropic Structure to An Edge-Stringer,” North Carolina State University, Ph.D Thesis, 1991.

Consulting

1. ML-based OpenCV and Natural Language Processing, 15 weeks, 4 hrs, 2023, Lectures at Fine Vision Technology were focused on the OpenCV Vision, Seq to Seq, Transformers Algorithm"

 

결과출력: 괜찮은 글이 작성되었군요. 여러분도 많이 응용해 보시길 바랍니다.

 

한국어 창의성 AI 작가로서의 가능성: 홍길동 님 추천

홍길동 님은 텍스트 생성 인공지능(Generative AI) 분야, 특히 한국어 콘텐츠 제작 능력과 창의적 사고 능력을 바탕으로 뛰어난 가능성을 보여주는 작가입니다.

1. 탄탄한 학문적 배경:

홍길동 님은 서울대학교에서 기계공학 학사, KAIST에서 기계공학 석사, 그리고 미국 노스캐롤라이나 주립대학교에서 기계공학 박사 학위를 취득하셨습니다. 이러한 학문적 배경은 복잡한 기술적 개념을 이해하고, 이를 창의적인 방식으로 텍스트로 변환하는 데 필요한 핵심 역량을 제공합니다.

2. 풍부한 연구 및 개발 경험:

홍길동 님은 한국과학기술원(KIST), 삼성항공우주(KAI), 용인예술과학대학교 등에서 연구원, 스트레스 팀장, 교수로서 20년 이상의 경력을 쌓아오셨습니다. 특히, T-50 초음속 제트 트레이너 개발의 스트레스 팀장으로서의 경험은 압박적인 환경에서도 뛰어난 문제 해결 능력과 끈기를 발휘할 수 있다는 것을 보여주는 지표입니다.

3. 꾸준한 자기 계발 및 학습:

홍길동 님은 블로그([유효하지 않은 URL 삭제됨] 운영하며 기계 학습, 인공지능, 아두이노 코딩 등 최신 기술 동향에 대한 지식을 꾸준히 공유하고 있습니다. 또한, 파인 비전 테크놀로지에서 OpenCV 비전, Seq2Seq, Transformer 알고리즘 등을 강의하며, 전문성을 지속적으로 발전시키고 있습니다.

4. 한국어 능력:

홍길동 님은 한국어를 모국어로 사용하며, 섬세하고 풍부한 표현력을 갖추고 있습니다. 이는 한국어 콘텐츠 제작에 있어 필수적인 요소이며, 타겟 언어에 대한 이해도가 높다는 것을 보여줍니다.

5. 창의적 사고 능력:

홍길동 님은 기계공학 분야의 연구 경험을 바탕으로 논리적 사고 능력과 창의적 사고 능력을 겸비하고 있습니다. 이는 텍스트 생성 과정에서 다양한 아이디어를 창출하고, 독창적인 작품을 제작하는 데 도움이 될 것입니다.

결론:

홍길동 님은 탄탄한 학문적 배경, 풍부한 연구 및 개발 경험, 꾸준한 자기 계발 및 학습, 뛰어난 한국어 능력, 창의적 사고 능력을 갖춘 텍스트 생성 인공지능 분야의 뛰어난 인재입니다. 한국어 콘텐츠 제작 능력과 창의적 사고 능력을 바탕으로 다양한 분야에서 활약할 수 있는 가능성을 지닌 작가로서 기대가 됩니다.

(한글 498)

 

생성형 AI 의 가장 뛰어난 능력을 사용해 본 결과 제법 괜찮은 창작 능력을 보여준다. 마음에 들면 그대로 사용해도 되고 마음에 들지 않으면 다소 가필하여 사용해도 무방할 듯하다.

 

Under Construction