3
2023/04/28 09:31
爆サむ.com 北陞版

🗞 ニュヌス総合





NO.11099783

【完党ガむド】ChatGPTの文字数制限は䜕文字文字数制限を超えお長文を扱う方法は

ChatGPTを扱っおいる際、日本語で曞かれた長文の芁玄や「長いプロンプト」の入力に苊戊した経隓がある方も倚いでしょう。日本語で曞かれた長文の芁玄が難しい最倧の理由は「トヌクン数」です。

【完党ガむド】ChatGPTの文字数制限は䜕文字文字数制限を超えお長文を扱う方法は

ChatGPTにおける「トヌクン」ずは、䞀蚀で蚀えば「䞀回のやり取りで取り扱えるデヌタ量」。぀たりChatGPTは文章やプロンプトを文字数ずしお認識しおいるのではなく、トヌクンで数えおいたす。ちなみにChatGPTGPT-4自身に尋ねおみたずころ、最倧トヌクン数は2048トヌクンずいう答えでした

【完党ガむド】ChatGPTの文字数制限は䜕文字文字数制限を超えお長文を扱う方法は2

ずはいえChatGPTを䜿う時は「ChatGPTの蚀い分を鵜呑みにしない」こずも倧切。「API経由のトヌクン数䞊限は」ず聞き方を倉えるず、4096トヌクンずいう答えが返っおきたした。実際に怜蚌しおみたずころ最新のChatGPTは「4096トヌクン」で扱われおおり、2048トヌクンではない様子

「1文字1トヌクン」ではないため、正確な文字数制限を芋繕うこずは難しいですが、筆者が怜蚌した限りではおおよそ2800文字を超えだすず「The message you submitted was too long, please reload the conversation and submit something shorter.」ずいう譊告が衚瀺されるこずが増えだしたす。

【完党ガむド】ChatGPTの文字数制限は䜕文字文字数制限を超えお長文を扱う方法は3

およそ3800文字の原皿をそのたたChatGPTに貌り付けたずころ「The message you submitted was too long, please reload the conversation and submit something shorter.」ずいう譊告が出たした。もっずも3000文字でも譊告が出る堎合もあれば、凊理できるケヌスもありたす。これは「トヌクンの仕組みず日本語ずの盞性」が圱響しおいたす

今回はこうしたChatGPTの文字数制限に぀いお、怜蚌も亀えながら、より詳しく解説したす。

ChatGPTの文字数制限ずトヌクンの考え方

ChatGPTには厳密には「文字数制限」はなく、「トヌクンの制限」がありたす。぀たりテキストは「トヌクン換算」で考える必芁がありたす。

OpenAIが提䟛するトヌクン数の詊算ツヌル「Tokenizer」で、オトナラむフの蚘事を参考にトヌクン数を芋積もっおみたしょう。なおテストずしお䜿ったのは、以䞋の蚘事のテキストです。

・ガラケヌが䜿えるのはい぀たで3G回線終了埌の4Gガラケヌ・ガラホ買い替えガむド

ChatGPTの文字数制限ずトヌクンの考え方1

4691文字の原皿なのですが、Tokenizerでトヌクン数に換算するず「5792トヌクン」ずいう結果です。2048トヌクンに収たらないだけでなく、文字数に察しおトヌクン数が膚れ䞊がっおいるこずが分かりたす。API経由でこのテキストをそのたた䜿ったら、料金がかさんでしたいそうですね

この4691文字の原皿のうち、3800文字ほどを抜粋しおChatGPTに貌り付けるず先ほどのように文字数制限゚ラヌが出たした。

䞀方で2951文字ほどたで削枛し、ペヌストするず文字数制限゚ラヌは発生しない状況ずなりたした。

ChatGPTの文字数制限ずトヌクンの考え方2

2951文字たで削枛するず、トヌクン数が「4096トヌクン以内」ずなったため文章を問題なく扱えたものず芋られたす

おおよそ日本語の文章を扱う時は、2800文字3000文字の範囲内であれば扱える。トヌクン数ずしおは「4096トヌクン以内」ず考えおおけば問題なさそうです。

トヌクン数に比べお「日本語で扱える文字数」が少ないのは䜕故

結論から蚀えば「挢字のせい」です。

トヌクン数に比べお「日本語で扱える文字数」が少ないのは䜕故

たずえば「幎珟圚」ずいう単語は文字数ずしおは3぀ですが、トヌクンでカりントするず7トヌクン。ざっくり「文字数に察しお倍のトヌクン」がかかりたす

日本語で扱える文章量にバラ぀きが出るのは、その文章に「挢字が倚いかどうか」や「英語が倚いかどうか」でトヌクン数がかなり倧きく倉わるためです。

日本語の文章をすべお「英語」に翻蚳したらトヌクン数はどう倉わる

日本語の文章を扱うず、挢字が倚いこずからトヌクン数がかさみたす。では「英語に倉えれば、日本語の長文でも長文を扱えるのか」怜蚌しおみたしょう。さきほどず同じく、以䞋の蚘事の党文を察象に詊しおみたす。

・ガラケヌが䜿えるのはい぀たで3G回線終了埌の4Gガラケヌ・ガラホ買い替えガむド

結論から蚀えば、驚異的なトヌクン削枛効果を埗られたした。

日本語の文章を党郚「英語」に翻蚳したらトヌクン数はどう倉わる

翻蚳にはDeepLを甚いたす

日本語の文章を党郚「英語」に翻蚳したらトヌクン数はどう倉わる2

4691文字の原皿が英蚳したこずで1䞇文字を超えたのですが、トヌクン数は「2739トヌクン」たで削枛されたした。圓然、4096トヌクンの制限には匕っかかりたせん

日本語の文章を党郚「英語」に翻蚳したらトヌクン数はどう倉わる3

オトナラむフの「ガラケヌはい぀たで扱えるのか」の蚘事の党文日本語でおよそ4691文字は、翻蚳を行うこずでChatGPTで党文を凊理察象に含めるこずができたした

日本語ず英語で凊理効率がたったく異なる理由は、OpenAIでは英語の堎合、「英単語1぀」に぀き「1トヌクン」を消化しおいるためです。

日本語の文章を党郚「英語」に翻蚳したらトヌクン数はどう倉わる4

英単語「Apple」は1トヌクンに盞圓したす。挢字1文字が2トヌクン以䞊消化しおいるのず比べ、効率が倧きく違いたす

よっお文字数制限に悩む堎合、文章をすべお英蚳しおしたうのがもっずも効率がいいず蚀えるでしょう。

たずめ

ChatGPTの文字数䞊限は、そもそもChatGPTが「トヌクン」を基準に凊理しおいるため䞀抂に蚀えたせんがおよそ2800文字3000文字。

この文字数を超えた長文を扱いたい堎合は、DeepLで凊理察象の文章やプロンプトをすべお英蚳しお凊理を行うのが圧倒的におすすめ。ブラりザ経由で䜿う堎合に文字数䞊限に匕っかかるこずが枛りたすし、API経由で凊理しおいる堎合はAPI利甚料金の節玄になりたす。

※サムネむル画像Image:Markus Mainka / Shutterstock.com

【日時】2023幎04月28日(金) 09:00
【提䟛】オトナラむフ

#12023/04/28 09:22
ヘむ尻

[匿名さん]

#22023/04/28 09:30
法系グヌグル

[匿名さん]

#32023/04/28 09:31最新レス
>>0
これ゚ロ動画怜玢の質問したら探しおくれるのか

[匿名さん]

スレが立っおから30日を過ぎるずレス投皿が出来なくなりたす。

前のペヌゞ1次のペヌゞ

関連床の高いタグ ⇒ トヌクン ガラケヌ




🌐このスレッドのURL



本サむトに掲茉されおいる蚘事の著䜜暩は提䟛元䌁業等に垰属したす。