大家好,我是技术宅小伙,今天要跟大家分享一下我之前写的 GPT 长文本处理程序。当时我写完后就把它放到 Hog
上了,因为最开始是为了自己用,所以后来就忘掉了。最近有同学把它翻出来用,然后经常来问我,说不知道这个东西怎么用。其实在我看来这个挺简单的,但是如果你没有一些关于
GPT 或者说 OPPO AI 的基础知识的话,那你来用它可能就会有一些问题。所以今天我专门录一个文章来讲一下。

首先我们要来说为什么你需要这么一个长文本处理程序。通常情况下我们有一个对话窗口,然后你跟 GPT
来进行聊天就好了,但是这个聊天他的长度是有限的。有很多同学最近在网上钻研,说怎么在 GPT
的官方聊天界面里边去输入尽可能多的内容,但事实上呢,如果官方也是后边也是模型,前面是一个意外的话,他其实真正受到限制的是他后边的这个模型的 Max
tokens,就是他可以接收的最大 token 数量。有可能说官方用的这个模型 token 数更多,但是也不会特别的多。现在我们已知的说你用
GPT4,然后有一个 32K 的 token,且这个 token 是非常高的,但是有非常的贵。

BAT 就是长文本处理程序,它是什么样一个逻辑呢?就是说虽然你 GPT
一次只能处理一定量的数据,但没有关系我们可以把一个非常长的文本给分成段落,然后每一个段落放进去然后来处理。处理完了以后把这些结果全部拼起来,再变成一个文本,这样就完成了对常文本的一个处理。当然这个具体的处理指什么,我们这里给了一个例子是说,你可以把这个英文给它翻成中文,这是一个翻译,一段一段翻,翻完了最后把所有翻好的拼接起来。当然你说我是不是也可以做其他的,当然可以,你可以通过写这个提示词,然后来指示它干什么。有同学说我不会写提示词,虽然说提示词他是一个专有名词,但是在
GPT
这个里边,他其实就是用自然语言来描述你想干什么。比方说我们现在来举一个例子,我之前写过一本电子书叫做经济副业假设,假设我们现在要把这本书然后翻译成繁体中文,要怎么做呢?就如果你没有这个
BAT
这个东西,那你可能就要一段一段的来粘贴,然后来复制。那如果有了它呢,我就最简单的方式就是首先我们把它整理成一个文本,一个长文本。但这个地方就是,然后我们把它存成
txt,然后把它处理成每个段落的长度,然后我们就可以来开始处理了。

点一下提交,然后你可以看到他在这个地方就已经开始在处理了,是 15
段里边的第二段。因为这个返回不是像这个聊天一样是一个字一个字返回的,所以他整体返回会比较慢。如果你想知道一些细节的话,你可以按一下 F12,然后你可以通过
network
来看见他是不是在正常工作。这个翻译完的内容会缓存到你这个浏览器里边,所以如果你翻译失败了,你在其中的一个地方,然后他的这个行为中断了,那你也不用着急,你可以到时候重新再照着这个一模一样的来进行。

除了对文本进行翻译,这个长文本处理程序还可以用于其他用途。比如在进行自然语言生成时,我们可以将一篇长文本的内容输入到 GPT
中,让它生成一些新的文章段落,这样可以得到更加丰富的内容。此外,在进行文本分类时,也可以将一篇长文本输入到 GPT
中,然后根据生成的文本内容来判断它的类别。总之,这个长文本处理程序可以帮助我们更好地使用 GPT,提高我们的文本处理效率。

如果你想要使用这个长文本处理程序,可以先将需要处理的文本整理成一个 txt
文件,然后将其上传到程序中。程序会自动将文本分段,并进行相应的处理。如果你对程序的使用还有其他疑问,可以随时联系我,我会尽力为你解答。
大家好,我是技术宅小伙,今天要跟大家分享一下我之前写的 GPT 长文本处理程序。当时我写完后就把它放到 Hog
上了,因为最开始是为了自己用,所以后来就忘掉了。最近有同学把它翻出来用,然后经常来问我,说不知道这个东西怎么用。其实在我看来这个挺简单的,但是如果你没有一些关于
GPT 或者说 OPPO AI 的基础知识的话,那你来用它可能就会有一些问题。所以今天我专门录一个文章来讲一下。

首先我们要来说为什么你需要这么一个长文本处理程序。通常情况下我们有一个对话窗口,然后你跟 GPT
来进行聊天就好了,但是这个聊天他的长度是有限的。有很多同学最近在网上钻研,说怎么在 GPT
的官方聊天界面里边去输入尽可能多的内容,但事实上呢,如果官方也是后边也是模型,前面是一个意外的话,他其实真正受到限制的是他后边的这个模型的 Max
tokens,就是他可以接收的最大 token 数量。有可能说官方用的这个模型 token 数更多,但是也不会特别的多。现在我们已知的说你用
GPT4,然后有一个 32K 的 token,且这个 token 是非常高的,但是有非常的贵。

BAT 就是长文本处理程序,它是什么样一个逻辑呢?就是说虽然你 GPT
一次只能处理一定量的数据,但没有关系我们可以把一个非常长的文本给分成段落,然后每一个段落放进去然后来处理。处理完了以后把这些结果全部拼起来,再变成一个文本,这样就完成了对常文本的一个处理。当然这个具体的处理指什么,我们这里给了一个例子是说,你可以把这个英文给它翻成中文,这是一个翻译,一段一段翻,翻完了最后把所有翻好的拼接起来。当然你说我是不是也可以做其他的,当然可以,你可以通过写这个提示词,然后来指示它干什么。有同学说我不会写提示词,虽然说提示词他是一个专有名词,但是在
GPT
这个里边,他其实就是用自然语言来描述你想干什么。比方说我们现在来举一个例子,我之前写过一本电子书叫做经济副业假设,假设我们现在要把这本书然后翻译成繁体中文,要怎么做呢?就如果你没有这个
BAT
这个东西,那你可能就要一段一段的来粘贴,然后来复制。那如果有了它呢,我就最简单的方式就是首先我们把它整理成一个文本,一个长文本。但这个地方就是,然后我们把它存成
txt,然后把它处理成每个段落的长度,然后我们就可以来开始处理了。

点击提交按钮,你可以看到程序已经在处理长度为15段的第二段了。返回结果不像聊天一样一字一字地返回,所以整体返回会比较慢。如果你想了解更多细节,可以按F12键,通过network查看它是否正常工作。翻译完的内容会缓存到你的浏览器中,所以如果你在处理过程中遇到问题,处理被中断了,你也不用着急,你可以重新按照相同的步骤进行处理。

除了对文本进行翻译,这个长文本处理程序还可以用于其他用途。比如在进行自然语言生成时,我们可以将一篇长文本的内容输入到GPT中,让它生成一些新的文章段落,这样可以得到更加丰富的内容。此外,在进行文本分类时,也可以将一篇长文本输入到GPT中,然后根据生成的文本内容来判断它的类别。总之,这个长文本处理程序可以帮助我们更好地使用GPT,提高我们的文本处理效率。

如果你想要使用这个长文本处理程序,可以先将需要处理的文本整理成一个txt文件,然后将其上传到程序中。程序会自动将文本分段,并进行相应的处理。如果你对程序的使用还有其他疑问,可以随时联系我,我会尽力为你解答。

技术
下载桌面版
GitHub
Gitee
SourceForge
百度网盘(提取码:draw)
云服务器优惠
华为云优惠券
腾讯云优惠券
阿里云优惠券
Vultr优惠券
站点信息
问题反馈
邮箱:[email protected]
吐槽一下
QQ群:766591547
关注微信