NVIDIA stellt bahnbrechende Fortschritte in Visual AI vor und erobert die CVPR-Konferenz.
Die 5 wichtigsten Aussagen:
- NVIDIA-Forscher präsentieren auf der Konferenz für Computer Vision und Mustererkennung (CVPR) neue Modelle und Techniken für visuelle generative KI, die Bereiche wie benutzerdefinierte Bildgenerierung, 3D-Szenenbearbeitung, visuelles Sprachverständnis und autonome Fahrzeugwahrnehmung abdecken.
- Zwei der über 50 von NVIDIA vorgestellten Forschungsprojekte wurden als Finalisten für die besten Paper Awards der CVPR ausgewählt. Eines untersucht die Trainingsdynamik von Diffusionsmodellen, das andere befasst sich mit hochauflösenden Karten für selbstfahrende Autos.
- NVIDIA hat die CVPR Autonomous Grand Challenge im Track End-to-End Driving at Scale gewonnen und über 450 Einträge weltweit übertroffen. Diese Leistung zeigt NVIDIAs Pionierarbeit bei der Verwendung von generativer KI für umfassende Modelle für selbstfahrende Fahrzeuge.
- Ein Hauptforschungsprojekt ist JeDi, eine neue Technik, die es Kreativen ermöglicht, Diffusionsmodelle – den führenden Ansatz für die Text-zu-Bild-Generierung – schnell anzupassen, um spezifische Objekte oder Charaktere darzustellen, anstatt den zeitaufwändigen Prozess des Feintunings auf benutzerdefinierten Datensätzen durchlaufen zu müssen.
- Ein weiterer Durchbruch ist FoundationPose, ein neues Grundmodell, das sofort die 3D-Pose von Objekten in Videos verstehen und verfolgen kann, ohne individuelles Training. Es stellte einen neuen Leistungsrekord auf und könnte neue AR- und Robotikanwendungen ermöglichen.
Ganzen Artikel lesen:https://www.artificialintelligence-news.com/2024/06/17/nvidia-presents-latest-advancements-visual-ai/
KI-Update in Kurzform:
NVIDIA stellt auf der diesjährigen „Computer Vision and Pattern Recognition“ (CVPR) Konferenz in Seattle bahnbrechende Fortschritte in der visuellen KI vor. Die Palette reicht von individueller Bildgenerierung und 3D-Szenenbearbeitung bis hin zum Verständnis visueller Sprache und der Wahrnehmung autonomer Fahrzeuge. Besonders hervorzuheben sind zwei Projekte von NVIDIA: JeDi und FoundationPose. JeDi ermöglicht es Kreativen, Diffusionsmodelle – den führenden Ansatz zur Text-zu-Bild-Generierung – schnell anzupassen, um bestimmte Objekte oder Charaktere darzustellen.
FoundationPose versteht und verfolgt die 3D-Pose von Objekten in Videos ohne spezielles Training pro Objekt und könnte damit neue Anwendungen in AR und Robotik ermöglichen. NVIDIA’s vielseitige Forschung auf der CVPR zeigt, wie generative KI Kreativen helfen, die Automatisierung in der Fertigung und im Gesundheitswesen voranzutreiben und gleichzeitig Autonomie und Robotik voranzutreiben.