08/01/2024
Vì sao A.I không thể sao chép được thiết kế từ hình ảnh 360° ?
Khoảng thời gian 2 năm trở lại đây, trí thông minh nhân tạo (A.I) phát triển bùng nổ và trở thành từ khóa mà hầu như mọi người đều biết, đều quan tâm. Nhưng, liệu chúng ta đã hiểu rõ về nó chưa?
[Hình 1] Là 1 hình đồ họa phẳng (flatten image) do generative A.I thế hệ mới nhất tạo ra. Nó có chất lượng ngang với các diễn họa viên kiến trúc khá giỏi. Cho nên nếu sản phẩm là hình ảnh render phẳng, thì A.I sắp tới sẽ không thua kém con người. Có người sẽ nói: công trình xây dựng cần nhiều chất xám hơn thế, nhất là triển khai kĩ thuật chứ đâu chỉ cần vài hình ảnh render là xong. Đúng! Tương lai vẫn sẽ cần kỹ sư và kiến trúc sư. Nhưng nếu bạn là 1 kiến trúc sư với các thiết kế độc bản, không giống ai, bạn có lo ngại một ngày nào đó thiết kế của bạn sẽ bị A.I sao chép? Để hạn chế rủi ro, bạn sẽ hạn chế up hình ảnh sản phẩm của mình lên internet, nhưng điều đó sẽ ảnh hưởng đến việc xây dựng hình ảnh cá nhân/ thương hiệu của bạn.
[Hình 2] Hình này là screen cap 1 trong các dự án của tôi. Hãy để ý chuỗi chữ và số ở sau chữ "panorama" và 16 mảnh hình ảnh nhỏ
[Hình 3] Để giải thích đơn giản về công nghệ trình diễn hình ảnh 360° chúng ta hãy bắt đầu từ khái niệm spherical image. Spherical image là một khung lưới hình cầu (sphere) mà người quan sát đứng ở tâm hình cầu, hình ảnh sẽ được điền đầy vào ô lưới. Nhờ đó chúng ta có thể nhìn xung quanh mình mà không bị hạn chế như hình ảnh phẳng.
Công nghệ của tôi sẽ phân rã 01 hình ảnh phẳng thành 288 mảnh nhỏ, mỗi mảnh sẽ có 1 ID riêng biệt, sau đó gắn từng mảnh lên khung lưới của spherical image tại vị trí có ID trùng khớp.
A.I ngày nay có khả năng tự học như con người, miễn là có nguồn tư liệu để học. Nhưng vì không có cấu tạo như não người, nên vẫn còn 3 điều mà nó chưa thể làm được:
1. Sáng tạo ra thứ hoàn toàn mới, chưa có trong cơ sở dữ liệu
2. Trí thông minh cảm xúc. Nó chưa thể đoán được ẩn ý hoặc cảm xúc của con người thông qua câu chữ nên chưa thể ứng xử thông minh chiều lòng khách hàng như con người. Đôi khi con người nói vậy nhưng trong lòng lại nghĩ khác.
3. Khả năng mường tượng không gian. A.I có thể học và tạo ra hình ảnh phẳng rất nhanh, thứ mà các văn phòng thiết kế kiến trúc hiện nay đều làm được, gọi là giai đoạn render 3D. Nhưng nó chưa có khả năng mường tượng không gian như kiến trúc sư, nhất là ngôn ngữ thiết kế đồng nhất. Do đó, nó chưa hiểu được spherical image để mà tạo ra cái tương tự. Hơn thế, công nghệ của WAX là 288 mảnh nhỏ ghép lại, đã được mã hóa khiến cho A.I dù nhìn thấy cũng bị rối loạn và không thể sắp xếp lại được. Nó chỉ có thể copy được từng mảnh nhỏ xíu vô nghĩa trong đó.
Vậy, nếu như sử dụng công nghệ của tôi, các kiến trúc sư có thể thoải mái "flex" công trình của mình lên internet rồi!