Adobe已在开源工具中提供了一种工具,该工具旨在识别任何纯文本中随机生成的字符串。
该工具名为Pythonlifier,是用Python编写的,它利用机器学习来区分随机字符序列和普通文本序列。
当分析安全性和应用程序日志,或尝试发现可能意外泄露的凭据时,该开源项目应被证明是有帮助的。
无论是哈希,API密钥,随机生成的密码还是源代码,日志或配置文件中的其他类型的随机字符串,Stringlifier都应帮助轻松识别它们。
Stringlifier的源代码已发布在Adobe的公共GitHub存储库中,但该软件巨头还提供了包含预先训练的模型的“ pip”(Python软件包安装程序)安装软件包。
Adobe表示,除了名为Tripod的开源实用程序外,它还在查找数据集中的异常时已经使用该工具来识别随机字符串。
该团队使用了多种方法来预处理长字符串并将其转换为数字形式,但是当遇到随机字符串时,这些方法遇到了障碍,破坏了聚类算法。
通过用<RANDOM_STRING>替换所有随机字符序列,即使他们在参数中使用了随机哈希,该团队也能够更轻松地对相似类型的命令行进行分组。
“我们希望您发现穿线机有用。完整的源代码可在Adobe的GitHub存储库中找到。您还可以从该存储库中的Adobe安全团队中找到我们所有其他开源项目。我们期待得到反馈,欢迎您提供任何帮助。” Adobe指出。
该公司还提供有关如何开始使用Stringlifier的信息,以及有关用户在寻找不同类型的字符串时如何训练自己的模型的信息。