توانایی ویژه Phi-3-vision، مدل زبانی کوچک مایکروسافت، در درک تصاویر