当前位置：首页 > 优惠 >大语言模型>文章详情

Design2Code：多模态大语言模型在前端开发中的应用

推荐人：暴走AI| 商城: AI | 2个月前 (03-06)| 分类：大语言模型 | 热度：47 ℃

暂无评论

来自斯坦福大学、佐治亚理工学院、微软和谷歌DeepMind的研究人员推出Design2Code项目，它探索了多模态大语言模型（LLM）在前端开发中的应用。这项任务的目标是将视觉设计直接转化为代码实现，从而改变了前端开发的工作流程。想象一下，如果你有一个网站的设计草图，你希望有一个工具能够自动为你生成实现这个设计的网站代码。这就是Design2Code尝试解决的问题。

项目主页：https://salt-nlp.github.io/Design2Code

GitHub：https://github.com/NoviScl/Design2Code

主要功能：

Design2Code的主要功能是将网页的视觉设计（例如，一个截图）转换成可以渲染成该设计的HTML和CSS代码。这包括理解设计中的元素、布局和样式，并将这些视觉信息转换为结构化的代码。

视觉设计理解：多模态LLM能够接收设计图或网页截图作为输入，并理解其中的视觉元素、布局和设计意图。
代码生成：根据理解的设计信息，模型能够自动生成相应的前端代码，如HTML、CSS和JavaScript等。
优化与调整：生成的代码可以根据实际需求进行进一步的优化和调整，以满足特定的功能需求和性能要求。

主要特点：

多模态理解：Design2Code能够处理视觉和文本输入，这使得它能够理解和生成复杂的网页设计。
自动化评估：研究者们开发了一套自动评估指标，用于衡量生成的代码与参考网页的相似度。
人类评估：除了自动评估，还进行了人类评估，以了解用户对生成网页的满意度。
开源模型：研究者们还提供了一个开源的Design2Code-18B模型，它在性能上与商业API模型相匹配。

工作原理：

Design2Code通过多模态大语言模型（LLMs）来实现其功能。这些模型被训练来处理图像和文本输入，并生成文本输出。在Design2Code任务中，模型接收一个网页的截图作为输入，并生成相应的HTML和CSS代码。为了提高性能，研究者们开发了多种提示方法，包括文本增强提示和自我修订提示，以引导模型更好地理解和生成代码。

应用场景：

Design2Code的应用场景非常广泛，它可以帮助非专业开发者快速将他们的设计想法转化为实际的网站。例如，一个小型企业的老板可能有一个关于他们公司网站的清晰视觉概念，但不知道如何编写代码。使用Design2Code，他们可以提供一个设计草图，然后得到一个完整的网站代码，无需深入了解编程。此外，它还可以用于自动化测试网页设计工具，帮助设计师改进他们的设计，或者在教育环境中教授网页开发。