From eac9a99530a5c4a36f3e8349698eb5d7ec8df590 Mon Sep 17 00:00:00 2001
From: zhanmyz <yazhan.ma@intel.com>
Date: Mon, 31 Mar 2025 10:41:04 +0800
Subject: [PATCH] =?UTF-8?q?1.=20Solve=20the=20AC=20issue=20of=20Permute+VI?=
 =?UTF-8?q?EW=20and=20MULMAL=20issue=20in=20the=20phase=20of=20=E2=80=9C1.?=
 =?UTF-8?q?=20Process=20Prompt=20and=20predict=20the=20first=20token?=
 =?UTF-8?q?=E2=80=9D.=202.=20There=20is=20still=20an=20AC=20issue=20in=20t?=
 =?UTF-8?q?he=20"2.=20Predict=20the=20subsequent=20tokens=20phase"=20and?=
 =?UTF-8?q?=20it=20is=20being=20debugged.=20=20=20=20A=20deviation=20has?=
 =?UTF-8?q?=20been=20detected=20in=20the=20computation=20of=20OpenVINO's?=
 =?UTF-8?q?=20CPY=20Node=20at=20stage=202,=20and=20it=20is=20currently=20b?=
 =?UTF-8?q?eing=20fixed.?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 ggml/src/ggml-openvino.cpp              | 140 +++++++-----------------
 ggml/src/ggml-openvino/ggml-decoder.cpp |   7 ++
 ggml/src/ggml-openvino/utils.cpp        |  43 ++++----
 3 files changed, 70 insertions(+), 120 deletions(-)

diff --git a/ggml/src/ggml-openvino.cpp b/ggml/src/ggml-openvino.cpp
index a508aeea40..2279df1d6d 100644
--- a/ggml/src/ggml-openvino.cpp
+++ b/ggml/src/ggml-openvino.cpp
@@ -823,34 +823,34 @@ void ggml_backend_openvino_dup_bytes(struct ggml_tensor *dst) {
 }
 
 static void ggml_backend_openvino_transpose(ggml_tensor *dst) {
-    ov::Core core;
-    ov::Shape input_shape{static_cast<size_t>(dst->src[0]->ne[2]), static_cast<size_t>(dst->src[0]->ne[1]), static_cast<size_t>(dst->src[0]->ne[0])};
-    ov::Shape output_shape{static_cast<size_t>(dst->ne[2]), static_cast<size_t>(dst->ne[1]), static_cast<size_t>(dst->ne[0])};
-    auto input_param = std::make_shared<ov::op::v0::Parameter>(ov::element::f32, input_shape);
+    // ov::Core core;
+    // ov::Shape input_shape{static_cast<size_t>(dst->src[0]->ne[2]), static_cast<size_t>(dst->src[0]->ne[1]), static_cast<size_t>(dst->src[0]->ne[0])};
+    // ov::Shape output_shape{static_cast<size_t>(dst->ne[2]), static_cast<size_t>(dst->ne[1]), static_cast<size_t>(dst->ne[0])};
+    // auto input_param = std::make_shared<ov::op::v0::Parameter>(ov::element::f32, input_shape);
     
-    //auto res = std::make_shared<ov::op::v1::Transpose>(input_param, ov::op::v0::Constant::create(ov::element::i64, {3}, {0, 2, 1})); 
+    // //auto res = std::make_shared<ov::op::v1::Transpose>(input_param, ov::op::v0::Constant::create(ov::element::i64, {3}, {0, 2, 1})); 
     
     
 
-    auto new_shape_node = ov::op::v0::Constant::create(ov::element::i64,
-                                                    ov::Shape{output_shape.size()},
-                                                    std::vector<int64_t>(output_shape.begin(), output_shape.end()));
-    auto res = std::make_shared<ov::op::v1::Reshape>(input_param, new_shape_node, false);
+    // auto new_shape_node = ov::op::v0::Constant::create(ov::element::i64,
+    //                                                 ov::Shape{output_shape.size()},
+    //                                                 std::vector<int64_t>(output_shape.begin(), output_shape.end()));
+    // auto res = std::make_shared<ov::op::v1::Reshape>(input_param, new_shape_node, false);
 
 
 
 
-    std::shared_ptr<ov::Model> model = std::make_shared<ov::Model>(ov::OutputVector{res},
-                                                                    ov::ParameterVector{input_param});
-    auto compiled_model = core.compile_model(model, "CPU");
-    ov::InferRequest infer_request = compiled_model.create_infer_request();
+    // std::shared_ptr<ov::Model> model = std::make_shared<ov::Model>(ov::OutputVector{res},
+    //                                                                 ov::ParameterVector{input_param});
+    // auto compiled_model = core.compile_model(model, "CPU");
+    // ov::InferRequest infer_request = compiled_model.create_infer_request();
 
-    ov::Tensor input_tensor(ov::element::f32, input_shape, dst->src[0]->data);
-    ov::Tensor output_tensor(ov::element::f32, output_shape, dst->data);
-    infer_request.set_input_tensor(0, input_tensor);
-    infer_request.set_output_tensor(0, output_tensor);
+    // ov::Tensor input_tensor(ov::element::f32, input_shape, dst->src[0]->data);
+    // ov::Tensor output_tensor(ov::element::f32, output_shape, dst->data);
+    // infer_request.set_input_tensor(0, input_tensor);
+    // infer_request.set_output_tensor(0, output_tensor);
 
-    infer_request.infer();
+    // infer_request.infer();
 
     // NOP
     GGML_UNUSED(dst);
@@ -1004,7 +1004,7 @@ static enum ggml_status ggml_backend_openvino_graph_compute(ggml_backend_t backe
             reshape_indices.push_back(i);
         // } else if (cgraph->nodes[i]->op == GGML_OP_VIEW) {
         } else if (cgraph->nodes[i]->op == GGML_OP_VIEW) {
-            // if (cgraph->nodes[i]->src[0]->ne[0] == 98304)
+            // if (cgraph->nodes[i]->src[0]->ne[0] == 98304 && (cgraph->nodes[i]->ne[0] == 3072 || cgraph->nodes[i]->ne[0] == 1))
             //     continue;
             view_indices.push_back(i);
             if (cgraph->nodes[i]->ne[0] == 32) {
@@ -1045,16 +1045,25 @@ static enum ggml_status ggml_backend_openvino_graph_compute(ggml_backend_t backe
                 ggml_backend_openvino_transpose(cgraph->nodes[i]);
             } else if (std::find(cpy_indices.begin(), cpy_indices.end(), i) != cpy_indices.end()) {
                 ggml_backend_openvino_cpy(cgraph->nodes[i]);
-            } else if (std::find(permute_indices.begin(), permute_indices.end(), i) != permute_indices.end()) {
-                ggml_backend_openvino_permute(cgraph->nodes[i]);
-            // } else if (std::find(mul_mat_indices.begin(), mul_mat_indices.end(), i) != mul_mat_indices.end()) {
-            //     ggml_backend_openvino_mul_mat(cgraph->nodes[i]);
+            // } else if (std::find(permute_indices.begin(), permute_indices.end(), i) != permute_indices.end()) {
+            //     ggml_backend_openvino_permute(cgraph->nodes[i]);
             } else if (std::find(view_indices.begin(), view_indices.end(), i) != view_indices.end()) {
                 ggml_backend_openvino_view(cgraph->nodes[i]);
             } else if (std::find(cont_indices.begin(), cont_indices.end(), i) != cont_indices.end()) {
                 ggml_backend_openvino_dup_bytes(cgraph->nodes[i]);
             } else if (std::find(reshape_indices.begin(), reshape_indices.end(), i) != reshape_indices.end()) {
                 ggml_backend_openvino_reshape(cgraph->nodes[i]);
+
+            // } else if (std::find(mul_mat_indices.begin(), mul_mat_indices.end(), i) != mul_mat_indices.end()) {
+            //     ggml_backend_openvino_mul_mat(cgraph->nodes[i]);
+            // } else if (std::find(view_indices_prompt.begin(), view_indices_prompt.end(), i) != view_indices_prompt.end()) {
+            //     ggml_backend_openvino_view(cgraph->nodes[i]);
+            // }else if (std::find(view_split.begin(), view_split.end(), i) != view_split.end()) {
+            //     ggml_backend_openvino_view(cgraph->nodes[i]);
+            // }else if (std::find(cpy_split_16.begin(), cpy_split_16.end(), i) != cpy_split_16.end()) {
+            //     ggml_backend_openvino_cpy(cgraph->nodes[i]);
+            // }else if (std::find(cpy_split_19.begin(), cpy_split_19.end(), i) != cpy_split_19.end()) {
+            //     ggml_backend_openvino_cpy(cgraph->nodes[i]);
             } else {
                 // Process a range of nodes with openvino_frontend_compute
                 int start_index = i;
@@ -1062,11 +1071,16 @@ static enum ggml_status ggml_backend_openvino_graph_compute(ggml_backend_t backe
                         && std::find(add_indices.begin(), add_indices.end(), i) == add_indices.end()
                         && std::find(transpose_indices.begin(), transpose_indices.end(), i) == transpose_indices.end()
                         && std::find(cpy_indices.begin(), cpy_indices.end(), i) == cpy_indices.end()
-                        && std::find(permute_indices.begin(), permute_indices.end(), i) == permute_indices.end()
-                        // && std::find(mul_mat_indices.begin(), mul_mat_indices.end(), i) == mul_mat_indices.end()
+                        // && std::find(permute_indices.begin(), permute_indices.end(), i) == permute_indices.end()
                         && std::find(view_indices.begin(), view_indices.end(), i) == view_indices.end()
                         && std::find(cont_indices.begin(), cont_indices.end(), i) == cont_indices.end()
                         && std::find(reshape_indices.begin(), reshape_indices.end(), i) == reshape_indices.end()
+
+                        // && std::find(mul_mat_indices.begin(), mul_mat_indices.end(), i) == mul_mat_indices.end()
+                        // && (std::find(view_indices_prompt.begin(), view_indices_prompt.end(), i) == view_indices_prompt.end())
+                        // && std::find(view_split.begin(), view_split.end(), i) == view_split.end()
+                        // && std::find(cpy_split_16.begin(), cpy_split_16.end(), i) == cpy_split_16.end()
+                        // && std::find(cpy_split_19.begin(), cpy_split_19.end(), i) == cpy_split_19.end()
                         ) {
                     i++;
                 }
@@ -1075,85 +1089,9 @@ static enum ggml_status ggml_backend_openvino_graph_compute(ggml_backend_t backe
                 }
             }
         }
-        // int end_node = cgraph->n_nodes - 1;
-        // openvino_frontend_compute(backend, cgraph, 0, end_node, prompt_process_flag);
-        // for (int i = 0; i < cgraph->n_nodes; i++) {
-        //     // if (std::find(view_indices_prompt.begin(), view_indices_prompt.end(), i) != view_indices_prompt.end()) {
-        //     //         ggml_backend_openvino_view(cgraph->nodes[i]);
-        //     if (std::find(view_indices.begin(), view_indices.end(), i) != view_indices.end()) {
-        //         ggml_backend_openvino_view(cgraph->nodes[i]);
-        //     } else if (std::find(cont_indices.begin(), cont_indices.end(), i) != cont_indices.end()) {
-        //         ggml_backend_openvino_dup_bytes(cgraph->nodes[i]);
-        //     } else if (std::find(reshape_indices.begin(), reshape_indices.end(), i) != reshape_indices.end()) {
-        //         ggml_backend_openvino_reshape(cgraph->nodes[i]);
-        //     } else {
-        //         // Process a range of nodes with openvino_frontend_compute
-        //         int start_index = i;
-        //         while (i < cgraph->n_nodes
-        //                 // && (std::find(view_indices_prompt.begin(), view_indices_prompt.end(), i) == view_indices_prompt.end())
-        //                 && std::find(view_indices.begin(), view_indices.end(), i) == view_indices.end()
-        //                 && std::find(cont_indices.begin(), cont_indices.end(), i) == cont_indices.end()
-        //                 && std::find(reshape_indices.begin(), reshape_indices.end(), i) == reshape_indices.end()
-        //                 ) {
-        //             i++;
-        //         }
-        //         if (start_index < i) {
-        //                 openvino_frontend_compute(backend, cgraph, start_index, --i, prompt_process_flag);
-        //         }
-        //     }
-        // }
     } else {
         int end_node = cgraph->n_nodes - 1;
         openvino_frontend_compute(backend, cgraph, 0, end_node, prompt_process_flag);
-        // for (int i = 0; i < cgraph->n_nodes; i++) {
-        //     if (std::find(add_indices.begin(), add_indices.end(), i) != add_indices.end()) {
-        //         ggml_backend_openvino_add_forward(cgraph->nodes[i]);
-        //     // } else if (std::find(transpose_indices.begin(), transpose_indices.end(), i) != transpose_indices.end()) {
-        //     //     ggml_backend_openvino_transpose(cgraph->nodes[i]);
-        //     // } else if (std::find(cpy_indices.begin(), cpy_indices.end(), i) != cpy_indices.end()) {
-        //     //     ggml_backend_openvino_cpy(cgraph->nodes[i]);
-        //     // } else if (std::find(permute_indices.begin(), permute_indices.end(), i) != permute_indices.end()) {
-        //     //     ggml_backend_openvino_permute(cgraph->nodes[i]);
-        //     // } else if (std::find(mul_mat_indices.begin(), mul_mat_indices.end(), i) != mul_mat_indices.end()) {
-        //     //     ggml_backend_openvino_mul_mat(cgraph->nodes[i]);
-        //     // } else if (std::find(view_indices_prompt.begin(), view_indices_prompt.end(), i) != view_indices_prompt.end()) {
-        //     //     ggml_backend_openvino_view(cgraph->nodes[i]);
-        //     // } else if (std::find(view_indices.begin(), view_indices.end(), i) != view_indices.end()) {
-        //     //     ggml_backend_openvino_view(cgraph->nodes[i]);
-        //     // } else if (std::find(cont_indices.begin(), cont_indices.end(), i) != cont_indices.end()) {
-        //     //     ggml_backend_openvino_dup_bytes(cgraph->nodes[i]);
-        //     // } else if (std::find(reshape_indices.begin(), reshape_indices.end(), i) != reshape_indices.end()) {
-        //     //     ggml_backend_openvino_reshape(cgraph->nodes[i]);
-        //     // }else if (std::find(view_split.begin(), view_split.end(), i) != view_split.end()) {
-        //     //     ggml_backend_openvino_view(cgraph->nodes[i]);
-        //     // }else if (std::find(cpy_split_16.begin(), cpy_split_16.end(), i) != cpy_split_16.end()) {
-        //     //     ggml_backend_openvino_cpy(cgraph->nodes[i]);
-        //     // }else if (std::find(cpy_split_19.begin(), cpy_split_19.end(), i) != cpy_split_19.end()) {
-        //     //     ggml_backend_openvino_cpy(cgraph->nodes[i]);
-        //     } else {
-        //         // Process a range of nodes with openvino_frontend_compute
-        //         int start_index = i;
-        //         while (i < cgraph->n_nodes
-        //                 && std::find(add_indices.begin(), add_indices.end(), i) == add_indices.end()
-        //                 // && std::find(transpose_indices.begin(), transpose_indices.end(), i) == transpose_indices.end()
-        //                 // && std::find(cpy_indices.begin(), cpy_indices.end(), i) == cpy_indices.end()
-        //                 // && std::find(permute_indices.begin(), permute_indices.end(), i) == permute_indices.end()
-        //                 // && std::find(mul_mat_indices.begin(), mul_mat_indices.end(), i) == mul_mat_indices.end()
-        //                 // && (std::find(view_indices_prompt.begin(), view_indices_prompt.end(), i) == view_indices_prompt.end())
-        //                 // && std::find(view_indices.begin(), view_indices.end(), i) == view_indices.end()
-        //                 // && std::find(cont_indices.begin(), cont_indices.end(), i) == cont_indices.end()
-        //                 // && std::find(reshape_indices.begin(), reshape_indices.end(), i) == reshape_indices.end()
-        //                 // && std::find(view_split.begin(), view_split.end(), i) == view_split.end()
-        //                 // && std::find(cpy_split_16.begin(), cpy_split_16.end(), i) == cpy_split_16.end()
-        //                 // && std::find(cpy_split_19.begin(), cpy_split_19.end(), i) == cpy_split_19.end()
-        //                 ) {
-        //             i++;
-        //         }
-        //         if (start_index < i) {
-        //                 openvino_frontend_compute(backend, cgraph, start_index, --i, prompt_process_flag);
-        //         }
-        //     }
-        // }
     }
 
     return GGML_STATUS_SUCCESS;
diff --git a/ggml/src/ggml-openvino/ggml-decoder.cpp b/ggml/src/ggml-openvino/ggml-decoder.cpp
index 4ec1be7b4d..ec827e8006 100644
--- a/ggml/src/ggml-openvino/ggml-decoder.cpp
+++ b/ggml/src/ggml-openvino/ggml-decoder.cpp
@@ -161,6 +161,13 @@ void GgmlOvDecoder::set_input_output(ggml_tensor* node, std::map<std::string, gg
             // } else {
             //     outputs[node_name] = node;
             // }
+            // if (node->ne[0] == 3072 && node->ne[1] == 1 && node->ne[2] == 1) {
+            //     outputs[src0_name] = node;
+            //     m_output_names.push_back(src0_name);
+            // } else {
+            //     outputs[node_name] = node;
+            //     m_output_names.push_back(node_name);
+            // }
             outputs[node_name] = node;
             m_input_names.push_back(src0_name);
             m_op_node_name.emplace_back(src0_name, ggml_op_name(node->op));
diff --git a/ggml/src/ggml-openvino/utils.cpp b/ggml/src/ggml-openvino/utils.cpp
index 53fecd3b23..642f2b6662 100644
--- a/ggml/src/ggml-openvino/utils.cpp
+++ b/ggml/src/ggml-openvino/utils.cpp
@@ -44,24 +44,8 @@ std::vector<std::pair<std::string, ov::Tensor>> get_ggml_graph_input_tensors(std
             //     std::cout << "CONT input shape: " << input_shape << std::endl;
             // }
             input_tensor = ov::Tensor(ggml_decoder->get_input_type(name), input_shape, input_data);
-        // } else if (op_node_name == "CPY" && (!check_if_contiguous || input_shape[2] == 1)) { //[TODO]: Temporarily determine whether the node corresponding to the input tensor of the Phi-3 model CPY is continuous
-        // } else if (op_node_name == "CPY") {
-        //     std::vector<size_t> input_stride = ggml_decoder->get_input_stride(name);
-        //     ov::element::Type input_type = ggml_decoder->get_input_type(name);
-        //     size_t element_size = input_type.size();
-        //     // ov::Shape phys_shape;
-        //     static int iter = 0;
-        //     if (iter++ % 2 == 0) {
-        //         // phys_shape = {1, input_shape[1], input_stride[2] / element_size};
-        //         input_tensor = ov::Tensor(ov::element::f32, input_shape, input_data);
-        //     } else {
-        //         ov::Shape flat_shape = {1, 1, input_stride[0] / element_size};
-        //         input_tensor = ov::Tensor(ov::element::f16, flat_shape, input_data);
-        //     }
-        } else {
-            input_tensor = ov::Tensor(ggml_decoder->get_input_type(name), ggml_decoder->get_input_shape(name).to_shape(), input_data);
             // if(!flag) {
-            //     std::cout << std::left  << "[ " << std::setw(2) << inp << " ]: "
+            //     std::cout << std::left  << "*[" << std::setw(2) << inp << "]*: "
             //     << "Input Name: " << std::setw(20) << name
             //     << "Type: " << std::setw(5) << ggml_decoder->get_input_type(name)
             //     << "OP: " << std::setw(10) << op_node_name
@@ -77,14 +61,21 @@ std::vector<std::pair<std::string, ov::Tensor>> get_ggml_graph_input_tensors(std
             //     << std::right
             //     << std::endl;
             // }
-            // if (op_node_name == "MUL_MAT") {
+        } else {
+            input_tensor = ov::Tensor(ggml_decoder->get_input_type(name), ggml_decoder->get_input_shape(name).to_shape(), input_data);
+            // if(!flag) {
             //     std::cout << std::left  << "[ " << std::setw(2) << inp << " ]: "
-            //     << "Input MUL_MAT name: " << std::setw(20) << name
+            //     << "Input Name: " << std::setw(20) << name
+            //     << "Type: " << std::setw(5) << ggml_decoder->get_input_type(name)
+            //     << "OP: " << std::setw(10) << op_node_name
+            //     << "CONT: " << check_if_contiguous
             //     << ", shape: " << std::setw(4) << input_tensor.get_shape()[0] << " " << std::setw(4) << input_tensor.get_shape()[1] << " " << input_tensor.get_shape()[2]
             //     << ", address: "
             //     << std::setw(15) << input_tensor.data() << " "
             //     << std::setw(15) << ((float*)input_tensor.data())[0]
             //     << std::setw(15) << ((float*)input_tensor.data())[1]
+            //     << ", ne[0]-1: "
+            //     << std::setw(15) << ((float*)input_tensor.data())[input_tensor.get_shape()[0]-1]
             //     << ", ne[0]: "
             //     << std::setw(15) << ((float*)input_tensor.data())[input_tensor.get_shape()[0]] << std::right
             //     << std::setw(15) << ((float*)input_tensor.data())[input_tensor.get_shape()[0] + 1] << std::right
@@ -219,6 +210,8 @@ enum ggml_status openvino_frontend_compute(ggml_backend_t backend, struct ggml_c
         //                 << std::setw(15) << tensor->data << " "
         //                 << std::setw(15) <<  static_cast<float>(((float*)output_tensor.data())[0])
         //                 << std::setw(15) <<  static_cast<float>(((float*)output_tensor.data())[1])
+        //                 << ", ne[0]-1: "
+        //                 << std::setw(15) <<  static_cast<float>(((float*)output_tensor.data())[tensor->ne[0] - 1])
         //                 << ", ne[0]: "
         //                 << std::setw(15) <<  static_cast<float>(((float*)output_tensor.data())[tensor->ne[0]]) << std::right
         //                 << std::setw(15) <<  static_cast<float>(((float*)output_tensor.data())[tensor->ne[0] + 1]) << std::right
@@ -234,6 +227,8 @@ enum ggml_status openvino_frontend_compute(ggml_backend_t backend, struct ggml_c
         //                 << std::setw(15) << tensor->data << " "
         //                 << std::setw(15) <<  static_cast<float>(((float*)output_tensor_18.data())[0])
         //                 << std::setw(15) <<  static_cast<float>(((float*)output_tensor_18.data())[1])
+        //                 << ", ne[0]-1: "
+        //                 << std::setw(15) <<  static_cast<float>(((float*)output_tensor_18.data())[tensor->ne[0] - 1])
         //                 << ", ne[0]: "
         //                 << std::setw(15) <<  static_cast<float>(((float*)output_tensor_18.data())[tensor->ne[0]]) << std::right
         //                 << std::setw(15) <<  static_cast<float>(((float*)output_tensor_18.data())[tensor->ne[0] + 1]) << std::right
@@ -250,6 +245,8 @@ enum ggml_status openvino_frontend_compute(ggml_backend_t backend, struct ggml_c
         //                 << std::setw(15) << tensor->data << " "
         //                 << std::setw(15) <<  static_cast<float>(((float*)output_tensor_15.data())[0])
         //                 << std::setw(15) <<  static_cast<float>(((float*)output_tensor_15.data())[1])
+        //                 << ", ne[0]-1: "
+        //                 << std::setw(15) <<  static_cast<float>(((float*)output_tensor_15.data())[tensor->ne[0] - 1])
         //                 << ", ne[0]: "
         //                 << std::setw(15) <<  static_cast<float>(((float*)output_tensor_15.data())[tensor->ne[0]]) << std::right
         //                 << std::setw(15) <<  static_cast<float>(((float*)output_tensor_15.data())[tensor->ne[0] + 1]) << std::right
@@ -265,6 +262,8 @@ enum ggml_status openvino_frontend_compute(ggml_backend_t backend, struct ggml_c
         //         << std::setw(15) << input_tensor.data() << " "
         //         << std::setw(15) << ((float*)input_tensor.data())[0]
         //         << std::setw(15) << ((float*)input_tensor.data())[1]
+        //         << ", ne[0]-1: "
+        //         << std::setw(15) << ((float*)input_tensor.data())[input_tensor.get_shape()[0] - 1]
         //         << ", ne[0]: "
         //         << std::setw(15) << ((float*)input_tensor.data())[input_tensor.get_shape()[0]] << std::right
         //         << std::setw(15) << ((float*)input_tensor.data())[input_tensor.get_shape()[0] + 1] << std::right
@@ -281,6 +280,8 @@ enum ggml_status openvino_frontend_compute(ggml_backend_t backend, struct ggml_c
         //         << std::setw(15) << input_tensor_27.data() << " "
         //         << std::setw(15) << ((float*)input_tensor_27.data())[0]
         //         << std::setw(15) << ((float*)input_tensor_27.data())[1]
+        //         << ", ne[0]-1: "
+        //         << std::setw(15) << ((float*)input_tensor_27.data())[input_tensor_27.get_shape()[0] - 1]
         //         << ", ne[0]: "
         //         << std::setw(15) << ((float*)input_tensor_27.data())[input_tensor_27.get_shape()[0]] << std::right
         //         << std::setw(15) << ((float*)input_tensor_27.data())[input_tensor_27.get_shape()[0] + 1] << std::right
@@ -297,6 +298,8 @@ enum ggml_status openvino_frontend_compute(ggml_backend_t backend, struct ggml_c
         //         << std::setw(15) << input_tensor_29.data() << " "
         //         << std::setw(15) << ((float*)input_tensor_29.data())[0]
         //         << std::setw(15) << ((float*)input_tensor_29.data())[1]
+        //         << ", ne[0]-1: "
+        //         << std::setw(15) << ((float*)input_tensor_29.data())[input_tensor_29.get_shape()[0] - 1]
         //         << ", ne[0]: "
         //         << std::setw(15) << ((float*)input_tensor_29.data())[input_tensor_29.get_shape()[0]] << std::right
         //         << std::setw(15) << ((float*)input_tensor_29.data())[input_tensor_29.get_shape()[0] + 1] << std::right
@@ -313,6 +316,8 @@ enum ggml_status openvino_frontend_compute(ggml_backend_t backend, struct ggml_c
         //         << std::setw(15) << input_tensor_30.data() << " "
         //         << std::setw(15) << ((float*)input_tensor_30.data())[0]
         //         << std::setw(15) << ((float*)input_tensor_30.data())[1]
+        //         << ", ne[0]-1: "
+        //         << std::setw(15) << ((float*)input_tensor_30.data())[input_tensor_30.get_shape()[0] - 1]
         //         << ", ne[0]: "
         //         << std::setw(15) << ((float*)input_tensor_30.data())[input_tensor_30.get_shape()[0]] << std::right
         //         << std::setw(15) << ((float*)input_tensor_30.data())[input_tensor_30.get_shape()[0] + 1] << std::right