V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  wyd011011daniel  ›  全部回复第 1 页 / 共 37 页
回复总数  730
1  2  3  4  5  6  7  8  9  10 ... 37  
13 天前
回复了 jobives2023 创建的主题 Apple 0 元购,听书阅读器 Aurader 征集新功能
@wyd011011daniel #38 因为我觉得阅读作为安卓的比较领先的阅读软件,iOS 上并没有能够与它太好进行竞争的软件。如果能做这样的适配,我觉得能在一定程度上吸引从安卓转 iOS 的阅读用户。同时,我觉得这样子可以借助社区社群的力量完成大部分 TTS 服务的适配,也是一件好事
13 天前
回复了 jobives2023 创建的主题 Apple 0 元购,听书阅读器 Aurader 征集新功能
@wyd011011daniel #37 嗯,这是爱阅记的听书配置文件的 JSON 文件直接复制。甚至我觉得可以直接按照类似爱阅记或者阅读的模板直接进行导入因为无论是字节或者百度之类的 TTS ,这样的模板已经有较大的应用,我看到很多用户就是按照这样的模板直接填入自己的 API 进行听书,很多用户也会分享和使用,如果能够参考这样的配置文件就可以把这方面的用户进行一个吸引{
"loginUrl": "",
"maxWordCount": "",
"ratePercent": 0.5,
"ttsConfigGroup": "Azure",
"_ClassName": "JxdAdvCustomTTS",
"_TTSConfigID": "对应的 id",
"httpConfigs":
{
"useCookies": 1,
"headers":
{ }
},
"ttsHandles":
[
{
"paramsEx": "",
"nextPageForGetMedthod": 1,
"processType": 1,
"maxPageCount": 1,
"method": 0,
"requestByWebView": 0,
"nextPageParams":
{ },
"parser":
{
"playData": "ResponseData"
},
"url": "https://eastasia.tts.speech.microsoft.com/cognitiveservices/v1",
"params":
{
"text": "<speak version=\"1.0\" xmlns=\"http://www.w3.org/2001/10/synthesis\" xmlns:mstts=\"https://www.w3.org/2001/mstts\" xml:lang=\"zh-CN\"><voice name=\"zh-CN-XiaoxiaoNeural\"><prosody rate=\"-34.00%\"><mstts:express-as style=\"lyrical\" styledegree=\"1.6\">%@</mstts:express-as></prosody></voice></speak>"
},
"httpConfigs":
{
"useCookies": 1,
"customFormatParams": "params[text]",
"headers":
{
"User-Agent": "AiyueTTS",
"Content-Type": "application/ssml+xml",
"X-Microsoft-OutputFormat": "audio-24khz-48kbitrate-mono-mp3",
"ocp-apim-subscription-key": "对应的 key"
}
}
}
],
"_TTSName": "Azure 晓晓 gentle"
}
13 天前
回复了 jobives2023 创建的主题 Apple 0 元购,听书阅读器 Aurader 征集新功能
@jobives2023 #34

我对 API 兼容性还是挺期待的。如果开发者适配不同模型是有一些难度的话,建议可以引入类似“爱阅记”的自定义模式,允许用户自主配置 HTTP 请求。

对于具备一定技术基础(如了解 API 概念、熟悉云服务账户注册)的用户而言,在 AI 的辅助指导下,完成这类配置并非难事。如果平台能够提供可视化的自定义配置界面,或者支持导入他人分享的预设配置文件(简单的 json 文本),普通用户便只需填入自己的密钥( API Key )即可直接使用,这将大幅降低操作门槛。也就是说,每一个 AI 服务或者说语音 TTS 服务只需要某一个人完成适配,然后上传到例如 GitHub 的仓库里,就可以让所有用户一起使用,只需要填入自己的 API key 。此外,鉴于目前诸如小米等厂商已开放了自身的 TTS (语音合成)云服务,我觉得应该是有一定前景的。实际上阅读,爱阅记等软件就是这么做的。

然后你说的情感朗读,我知道真正的情感朗读是要带情感标签的,但是我自己是把语音情感当做一个全局化的设置作为特定音色进行听书。嗯,或者软件里的 TTS 使用的是 Azure 的 TTS 的话,也可以把那些情感类型和情感强度的选项加上。不过,Azure 的 TTS API 还是挺贵的,所以我期望是能够让用户用自己的。这样可以减轻开发者的负担
嗯,考虑到你说的是 58 块钱的买断软件,因此我设想它是一个不太需要很大的云服务成本的软件,假设它是一个离线的软件,假设它是 iOS 上的,那么我希望 58 块钱购买了一个离线的,不需要云服务器的软件,然后开发者在未来的生命周期里,续费他的开发者账户,并且每年进行基本的软件 API 的维护,我认为是合理需求。

嗯,有以下几点原因
首先是因为软件有大量开源软件或者免费工具通过广告赚钱的那种免费软件的竞争,然后还有 AI 能力的增强开发一个同类的相似软件的门槛成本并不是很高

其次是从经济学原理上讲,实体商品的生产成本边际成本是永远存在的,但是软件开发完成之后,无论是卖给多少个人,开发者的分发成本基本上没有变。比如说从苹果开发者的角度来讲,只要你续费每年 99 美金的开发者账户,你就不需要再出任何钱。当然我说的是离线软件的情况下。

最后是如果开发者需要进行一个长久的大量的维护或者是云端储存算力的开销,那么我认为,开发者应当转向订阅制。

或者换个角度说,用户花了 58 块钱购买了一个不需要云服务器的应用,那么开发者赚回每年的 99 美金。这件事情基本上不很难,特别是你卖出几万份的情况下,每年还可能再新增一些长尾用户,然后开发者还会开发其他软件,那样子他的 99 美金的年费就会平衡地分散到几个软件上,那么他相应的每个应用的成本也会特别低。然后只是对软件进行一个基础的应用维护,适配一下苹果例如 iOS 26 的玻璃动效这类效果,它的需求应当不是很大,所以我觉得是长久维护是合理的。就是你不提供新功能,然后你贩卖的是你的这份代码,然后你有一点点售后的感觉,把那些 API 进行一个稍微的适配。

同时,开发者的长尾维护这个行为也会持续增加,吸引更多新用户,而如果新用户看到你不再维护软件了,它自然就不选择购买,这是一个双向的选择。
询问一下是指没有打开网页全屏的情况下,可以去掉折叠评论区吗?因为在网页全屏的情况下,好像是有这个按钮的。因为我一般会默认打开网页全屏
我遇到这种问题的时候会下意识地从这个角度来思考,就是死人是没有什么思考他角度的意义的,所以我们需要从活人的角度思考,就是可以把这个问题转化成当你的亲朋好友去世的时候,你是否愿意他有一个 AI 的人工智能体,然后你去跟他对话,或者说嗯你是否觉得不是或者你是否觉得这是一件好事。

“死与我们无关。因为当我们存在时,死还不存在;而当死存在时,我们已经不存在了。”
13 天前
回复了 xin1284 创建的主题 Apple 假如苹果出相机,传统相机还活得下去吗?
我觉得可能的路径是这些第三方的相机软件,尽快地推出一些原生的效率更高的 APP ,类似于大疆 Mimo 。然后用户只需要用极简单的方式打开 APP 就可以快速导入照片到手机进行修图或者整理。反正我觉得做硬件这件事情 iPhone 是不需要做的,相反是那些硬件相机是需要去做软件来适配更现代化的工作流程。
13 天前
回复了 xin1284 创建的主题 Apple 假如苹果出相机,传统相机还活得下去吗?
我理解你认为对那些更大底片的相机的一个需求,但是我认为苹果做一个更大底的相机这件事情既不符合苹果的商业逻辑,就是苹果并不会赚到特别多的钱,同时 iPhone 的能力上限已经很高了,就是可能换一个更大的底并不是那么重要。
13 天前
回复了 xin1284 创建的主题 Apple 假如苹果出相机,传统相机还活得下去吗?
iPhone 能够拍 OpenGate 的视频,并且能够进入专业影视流程 F1 电影这样的影视工作流,那么它甚至在某种程度上是比微单相机还要厉害了。

富士或者其他那些风格化的微单相机,其实他们卖的某种程度上是一种风格或者算法,而苹果它不太在意,或者说风格或算法可以由第三方来完成。
13 天前
回复了 xin1284 创建的主题 Apple 假如苹果出相机,传统相机还活得下去吗?
我认为在苹果眼里,你所谓的那样的这个相机,实际上它就是 iPhone 。iPhone 已经在逐渐升级,最近的 17 Pro 已经能够支持苹果发布会的录制了。那么这种便携性相机又有什么好去抢他饭碗的呢?

实际上传统便携相机或者说甚至传统的重型的相机,它的市场规模是 iPhone 的一个零头罢了。 而且传统的相机它需要完整的计算摄影能力,完全可以交给电脑或者手机用第三方 APP 做。

如果你需要一个便携的放在口袋里的相机,那不就是 iPhone 吗? iPhone 上可以安装第三方的软件
13 天前
回复了 jobives2023 创建的主题 Apple 0 元购,听书阅读器 Aurader 征集新功能
@wyd011011daniel 然后本地的那个英文 TTS 非常好用,希望尽快能有中文的版本
13 天前
回复了 jobives2023 创建的主题 Apple 0 元购,听书阅读器 Aurader 征集新功能
之前已经兑换了永久会员,在线的中文 tts 使用的是 azure ,想知道能不能开放使用自己的 api ,然后可以让用户自己调节情感 情感强度 语速(这个重点是上传给 api 的时候就添加了语速,这样的效果比 1 倍速下来再变速效果好很多)

用户填入 https://eastasia.tts.speech.microsoft.com/cognitiveservices/v1 这样的 api 地址和自己的密钥 就可以使用

下面是我听书时候使用的配置 <speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="https://www.w3.org/2001/mstts" xml:lang="zh-CN"><voice name="zh-CN-XiaoxiaoNeural"><prosody rate="-34.00%"><mstts:express-as style="lyrical" styledegree="1.6">%@</mstts:express-as></prosody></voice></speak>

其中<mstts:express-as style="lyrical" styledegree="1.6"> 是情感和情感强度 调节这个能够很好的修改语音的感觉
@wyd011011daniel 看了一下 有挺多的配置 但是缺少 Azure 的 api 的自定义配置 如果可以的话希望能够支持,与 edge 的 tts 不同 azure 的 tts 需要账号注册绑定 azure 云的服务,绑定银行卡( visa )能够每个月 50W 字符的免费用额度 能够调节情感强度和语速 体验很好
平时会用爱阅记听书 使用的是 azure 的 TTS 不知道这个 app 能不能支持,特别是 azure 的个人的 api 然后可以调节情感强度,语速。xiaoxiao 的 200%情感 gentle 的 65%速度 是我习惯的睡前听书 特别是语速这一点 其他阅读器很少支持原生的 azure 的语速调节,直接变速的效果很差。 求个码 MTI1NjU2Mjk1MkBxcS5jb20=
苹果照片两种授权方式都可以。1 选择全部,仅允许选中的照片,拒绝 2 使用系统的照片选择器

例如 b 站小红书这样的软件就是就算你设置了仅允许选中的照片这个权限,但由于每次都需要去设置新建选择新的图片给软件,整个流程非常繁琐。

而 Chatgpt 这样的软件直接使用系统提供的图片选择工具,十分方便高效和隐私。

但由于任有一些 app 可能必须要全局的照片权限(例如图片相册备份的软件)导,苹果不能直接去掉前者权限,导致国产 app 还是使用前面的方法恶心用户
@Rache1 是安装 app 的时候 某些软件可能会新建一个软件名称的文件夹,每个软件默认只能读取自己文件夹的内容,软件如果需要读取其他文件夹需要授权。

卸载软件的时候这个文件夹也会被删除,一般是用来放软件自己相关的文件。

楼主应该是为了每次用浏览器下载的文件直接打开 localsend 发送,所以设置下载的默认保存地址为 localsend 的文件夹。

一般浏览器下载会在下载文件夹里,是不会删除其他软件的时候被影响。

然后楼主在没有意识到这个文件夹里还有很多自己需要的数据的情况下,删除了 localsend ,导致 localsend 文件夹也被删除了。

也可以类比的是默认下载位置保存在 win 端卸载微信的时候也会删除的文件夹,导致自己的文件在卸载微信的时候也被一并删除了。
28 天前
回复了 klii 创建的主题 iOS iOS 无法收到 TG 的通知
swftgram 流量可以正常推送
@beimenjun #109 了解了,还想问下,后台备份功能使用的是 26.1 提供的 PHBackgroundResourceUploadExtension 这个能力么
支持一下 有个想法 画中画进度是不是用实时活动更适合呢(当然我才下载还没有进行使用,也许已经支持了)
@PeiXyJ #10 邀请码 ER8723LR

账号使用邮箱注册之后还不能修改密码 ing

以及不知道为什么 侧边栏的全部展开全部折叠 效果都是展开
1  2  3  4  5  6  7  8  9  10 ... 37  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1400 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 16:55 · PVG 00:55 · LAX 09:55 · JFK 12:55
♥ Do have faith in what you're doing.