deeplx是否可以支持同时填入多个API #114

heheda123123 · 2024-04-19T01:33:24Z

https://linux.do/t/topic/60749
如帖子中提到的，沉浸式翻译支持在api处填入以逗号分隔的多个api
但是沉浸式翻译的实现可能有点问题

http://59.110.34.163:85/translate,https://101.132.242.99/translate,https://89.208.240.50/translate,http://67.61.193.42:51004/translate,https://154.18.161.26/translate,https://152.67.197.197/translate

翻译的时候轮询这些api，如果第一次翻译失败会自动用下一个api再尝试一次

The text was updated successfully, but these errors were encountered:

heheda123123 · 2024-04-19T04:14:06Z

糊了个deeplx代理，如果能实现这种效果最好，不然一个API经常会遇到查询太快没有响应的情况
https://linux.do/t/topic/61505/3

fishjar · 2024-04-20T01:59:22Z

https://linux.do/t/topic/60749 如帖子中提到的，沉浸式翻译支持在api处填入以逗号分隔的多个api 但是沉浸式翻译的实现可能有点问题
http://59.110.34.163:85/translate,https://101.132.242.99/translate,https://89.208.240.50/translate,http://67.61.193.42:51004/translate,https://154.18.161.26/translate,https://152.67.197.197/translate
翻译的时候轮询这些api，如果第一次翻译失败会自动用下一个api再尝试一次

可以做个对url轮寻，问题不大。失败重试也可以，不过可能需要接口在失败时返回非200状态码，这样比较好处理。

fishjar · 2024-04-20T02:00:02Z

糊了个deeplx代理，如果能实现这种效果最好，不然一个API经常会遇到查询太快没有响应的情况 https://linux.do/t/topic/61505/3

没有linux.do的帐号，看不到你发的链接内容。

heheda123123 · 2024-04-20T08:30:29Z

糊了个deeplx代理，如果能实现这种效果最好，不然一个API经常会遇到查询太快没有响应的情况 https://linux.do/t/topic/61505/3

没有linux.do的帐号，看不到你发的链接内容。

用法如下
1 把收集到的urls放在`urls.txt`，一行一个，比如下面这样
https://api.deeplx.org/
https://deeplx.papercar.top/
https://deepl.dlwlrma.xyz/

2 运行代理 
python xx.py
依赖
pip install gevent flask requests

3 设置沉浸式翻译里面的接口为
http://127.0.0.1:5000/translate

代码原理如下
1 启动时判断API有效性
2 每次翻译查询，由代理随机选择api进行查询，不行就切换，直到获得查询结果（尝试10次）

 
import random

import gevent
from gevent.pool import Pool
from gevent import monkey
from gevent.pywsgi import WSGIServer

monkey.patch_all()

import requests

requests.packages.urllib3.disable_warnings(
    requests.packages.urllib3.exceptions.InsecureRequestWarning
)
from flask import Flask, request
import json

app = Flask(__name__)

valid_urls = []


def check_url_availability(url):
    global valid_urls
    try:
        headers = {"Content-Type": "application/json"}
        payload = {
            "text": "Hello, world!",
            "source_lang": "EN",
            "target_lang": "ZH"
        }
        response = requests.post(url, verify=False, timeout=5, headers=headers,
                                 data=json.dumps(payload))
        if "你好，世界" in response.text:
            valid_urls.append(url)
    except Exception as e:
        print('%s: %s' % (url, type(e).__name__))


def get_valid_urls():
    with open("urls.txt", "r") as f:
        urls = f.read().splitlines()

    for i in range(len(urls)):
        urls[i] += "translate"
    urls = list(set(urls))
    p = Pool(50)
    jobs = [p.spawn(check_url_availability, _url) for _url in urls]

    gevent.joinall(jobs)


get_valid_urls()
print("available urls count: {}".format(len(valid_urls)))


def get_translate_data(text, source_lang, target_lang):
    count = 0
    while True:
        urls = random.choice(valid_urls)
        count += 1
        if count == 10:
            break
        try:
            headers = {"Content-Type": "application/json"}
            payload = {
                "text": text,
                "source_lang": source_lang,
                "target_lang": target_lang
            }
            response = requests.post(urls, verify=False, timeout=5, headers=headers,
                                     data=json.dumps(payload))
            data = response.json()
            if data["code"] == 200:
                return response.text
        except Exception as e:
            print('%s' % (type(e).__name__))


@app.route('/translate', methods=['POST'])
def translate():  # put application's code here
    data = json.loads(request.get_data())
    text = data['text']
    source_lang = data['source_lang']
    target_lang = data['target_lang']
    return get_translate_data(text, source_lang, target_lang)


if __name__ == '__main__':
    http_server = WSGIServer(("127.0.0.1", 5000), app)
    http_server.serve_forever()

heheda123123 · 2024-04-21T12:15:41Z

更新了下代码，之前是查询十次，直到获得翻译结果。现在是开3个任务并发查询，有一个返回就拿到翻译结果了
这样翻译速度快很多

import random

import gevent
from gevent.pool import Pool
from gevent import monkey
from gevent.pywsgi import WSGIServer

monkey.patch_all()

import requests

requests.packages.urllib3.disable_warnings(
    requests.packages.urllib3.exceptions.InsecureRequestWarning
)
from flask import Flask, request
import json

app = Flask(__name__)

valid_urls = []


def check_url_availability(url):
    global valid_urls
    try:
        headers = {"Content-Type": "application/json"}
        payload = {
            "text": "Hello, world!",
            "source_lang": "EN",
            "target_lang": "ZH"
        }
        response = requests.post(url, verify=False, timeout=5, headers=headers,
                                 data=json.dumps(payload))
        if "你好，世界" in response.text:
            valid_urls.append(url)
    except Exception as e:
        print('%s: %s' % (url, type(e).__name__))


def get_valid_urls():
    with open(R"urls.txt", "r") as f:
        urls = f.read().splitlines()

    for i in range(len(urls)):
        urls[i] += "translate"
    urls = list(set(urls))
    p = Pool(200)
    jobs = [p.spawn(check_url_availability, _url) for _url in urls]

    gevent.joinall(jobs)


get_valid_urls()
print("available urls count: {}".format(len(valid_urls)))

def single_translate(text, source_lang, target_lang):
    for i in range(10):
        urls = random.choice(valid_urls)
        try:
            headers = {"Content-Type": "application/json"}
            payload = {
                "text": text,
                "source_lang": source_lang,
                "target_lang": target_lang
            }
            response = requests.post(urls, verify=False, timeout=5, headers=headers,
                                     data=json.dumps(payload))
            data = response.json()
            if data["code"] == 200:
                return response.text
        except Exception as e:
            print('%s' % (type(e).__name__))

def get_translate_data(text, source_lang, target_lang):
    tasks = [gevent.spawn(single_translate, text, source_lang, target_lang) for _ in range(3)]
    done = gevent.wait(tasks, count=1)
    for t in tasks:
        t.kill()
    return done.pop().value


@app.route('/translate', methods=['POST'])
def translate():  # put application's code here
    data = json.loads(request.get_data())
    text = data['text']
    source_lang = data['source_lang']
    target_lang = data['target_lang']
    return get_translate_data(text, source_lang, target_lang)


if __name__ == '__main__':
    http_server = WSGIServer(("127.0.0.1", 5000), app)
    http_server.serve_forever()

fishjar · 2024-04-21T12:25:59Z

更新了下代码，之前是查询十次，直到获得翻译结果。现在是开3个任务并发查询，有一个返回就拿到翻译结果了这样翻译速度快很多

并发的缺点是，会使得翻译接口更容易达到频次限制。

fishjar · 2024-04-21T12:27:47Z

v1.8.8 将支持deeplx的多url轮寻，不过写死了3次重试，如果连续3个url都返回错误将翻译失败。

heheda123123 · 2024-04-21T14:17:53Z

更新了下代码，之前是查询十次，直到获得翻译结果。现在是开3个任务并发查询，有一个返回就拿到翻译结果了这样翻译速度快很多

并发的缺点是，会使得翻译接口更容易达到频次限制。

deeplx的好处就在这点，可用公开节点很多，我随便收集了下，有269个能用的
量大管饱（：，沉浸式翻译里面我设置的，每秒请求数20，3个段落。配合我上面的代理，用起来翻译速度也快

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

deeplx是否可以支持同时填入多个API #114

deeplx是否可以支持同时填入多个API #114

heheda123123 commented Apr 19, 2024

heheda123123 commented Apr 19, 2024

fishjar commented Apr 20, 2024

fishjar commented Apr 20, 2024

heheda123123 commented Apr 20, 2024

heheda123123 commented Apr 21, 2024 •

edited

fishjar commented Apr 21, 2024

fishjar commented Apr 21, 2024

heheda123123 commented Apr 21, 2024 •

edited

deeplx是否可以支持同时填入多个API #114

deeplx是否可以支持同时填入多个API #114

Comments

heheda123123 commented Apr 19, 2024

heheda123123 commented Apr 19, 2024

fishjar commented Apr 20, 2024

fishjar commented Apr 20, 2024

heheda123123 commented Apr 20, 2024

heheda123123 commented Apr 21, 2024 • edited

fishjar commented Apr 21, 2024

fishjar commented Apr 21, 2024

heheda123123 commented Apr 21, 2024 • edited

heheda123123 commented Apr 21, 2024 •

edited

heheda123123 commented Apr 21, 2024 •

edited