microsoft
diff --git a/‎language-extensions/dotnet-core-CSharp/README.md‎
Lines changed: 1 addition & 1 deletion b/‎language-extensions/dotnet-core-CSharp/README.md‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎language-extensions/dotnet-core-CSharp/src/managed/CSharpDataSet.cs‎
Lines changed: 5 additions & 0 deletions b/‎language-extensions/dotnet-core-CSharp/src/managed/CSharpDataSet.cs‎
Lines changed: 5 additions & 0 deletions
diff --git a/‎language-extensions/dotnet-core-CSharp/src/managed/CSharpInputDataSet.cs‎
Lines changed: 19 additions & 1 deletion b/‎language-extensions/dotnet-core-CSharp/src/managed/CSharpInputDataSet.cs‎
Lines changed: 19 additions & 1 deletion
diff --git a/‎language-extensions/dotnet-core-CSharp/src/managed/CSharpOutputDataSet.cs‎
Lines changed: 112 additions & 30 deletions b/‎language-extensions/dotnet-core-CSharp/src/managed/CSharpOutputDataSet.cs‎
Lines changed: 112 additions & 30 deletions
diff --git a/‎language-extensions/dotnet-core-CSharp/src/managed/CSharpParamContainer.cs‎
Lines changed: 42 additions & 0 deletions b/‎language-extensions/dotnet-core-CSharp/src/managed/CSharpParamContainer.cs‎
Lines changed: 42 additions & 0 deletions
diff --git a/‎language-extensions/dotnet-core-CSharp/src/managed/CSharpSession.cs‎
Lines changed: 3 additions & 1 deletion b/‎language-extensions/dotnet-core-CSharp/src/managed/CSharpSession.cs‎
Lines changed: 3 additions & 1 deletion
@@ -7,7 +7,7 @@ For more information about SQL Server Language Extensions, refer to this [docume
 
 The dotnet-core-CSharp-extension version in this repository is compatible with SQL Server 2019 CU3 onwards. It integrates .NET core in SQL Server and works with .NET 6.0 in **Windows only**.
 
-Currently, the extension supports the following data types: SQL_C_SLONG, SQL_C_ULONG, SQL_C_SSHORT, SQL_C_USHORT, SQL_C_SBIGINT, SQL_C_UBIGINT, SQL_C_STINYINT, SQL_C_UTINYINT, SQL_C_BIT, SQL_C_FLOAT, SQL_C_DOUBLE, SQL_C_CHAR. It supports the following SQL data types: int, bigint, smallint, tinyint, real, float, bit, varchar(n).
+Currently, the extension supports the following data types: SQL_C_SLONG, SQL_C_ULONG, SQL_C_SSHORT, SQL_C_USHORT, SQL_C_SBIGINT, SQL_C_UBIGINT, SQL_C_STINYINT, SQL_C_UTINYINT, SQL_C_BIT, SQL_C_FLOAT, SQL_C_DOUBLE, SQL_C_CHAR, SQL_C_WCHAR. It supports the following SQL data types: int, bigint, smallint, tinyint, real, float, bit, varchar(n), nvarchar(n).
 
 To use this dotnet-core-CSharp-lang-extension.zip package, follow [this tutorial](./sample/regex/README.md). For any fixes or enhancements, you are welcome to modify, rebuild and use the binaries using the following instructions.
 
 
@@ -46,5 +46,10 @@ private set
         /// This dictionary contains all the columns metadata as CSharpColumn objects.
         /// </summary>
         protected Dictionary<ushort, CSharpColumn> _columns = new Dictionary<ushort, CSharpColumn>();
+
+        /// <summary>
+        /// Gets the columns metadata dictionary.
+        /// </summary>
+        public Dictionary<ushort, CSharpColumn> Columns => _columns;
     }
 }
@@ -129,7 +129,25 @@ private unsafe void AddColumn(
                 case SqlDataType.DotNetChar:
                     int[] strLens = new int[rowsNumber];
                     Interop.Copy((int*)colMap, strLens, 0, (int)rowsNumber);
-                    CSharpDataFrame.Columns.Add(new StringDataFrameColumn(_columns[columnNumber].Name, DataSetUtils.StringSplitToArray(Interop.UTF8PtrToStr((char*)colData), strLens)));
+
+                    // Use byte-based splitting to properly handle multi-byte UTF-8 characters
+                    //
+                    CSharpDataFrame.Columns.Add(new StringDataFrameColumn(_columns[columnNumber].Name, DataSetUtils.UTF8ByteSplitToArray((byte*)colData, strLens)));
+                    break;
+                case SqlDataType.DotNetWChar:
+                    int[] wcharStrLens = new int[rowsNumber];
+                    Interop.Copy((int*)colMap, wcharStrLens, 0, (int)rowsNumber);
+    
+                    // For NCHAR/WCHAR, the strLenOrNullMap contains byte lengths, but we need character counts for UTF16PtrToStr
+                    // Each Unicode character is 2 bytes (sizeof(wchar_t)), so divide by 2 to get character count
+                    //
+                    int[] wcharCharLens = new int[rowsNumber];
+                    for (int i = 0; i < (int)rowsNumber; i++)
+                    {
+                        wcharCharLens[i] = wcharStrLens[i] > 0 ? wcharStrLens[i] / sizeof(char) : wcharStrLens[i];
+                    }
+
+                    CSharpDataFrame.Columns.Add(new StringDataFrameColumn(_columns[columnNumber].Name, DataSetUtils.StringSplitToArray(Interop.UTF16PtrToStr((char*)colData), wcharCharLens)));
                     break;
                 default:
                     throw new NotImplementedException("Column type for " + _columns[columnNumber].DataType.ToString() + " has not been implemented yet");
 
@@ -42,7 +42,12 @@ public class CSharpOutputDataSet: CSharpDataSet
         /// This method extracts metadata and actual data for each column supplied
         /// by extracting data and information from every DataFrameColumn.
         /// </summary>
-        public unsafe void ExtractColumns(DataFrame CSharpDataFrame)
+        /// <param name="CSharpDataFrame">The DataFrame containing the output data.</param>
+        /// <param name="inputColumns">
+        /// Optional dictionary of input column metadata (not used - C# extension always outputs ANSI strings
+        /// like Python/R extensions).
+        /// </param>
+        public unsafe void ExtractColumns(DataFrame CSharpDataFrame, Dictionary<ushort, CSharpColumn> inputColumns = null)
         {
             Logging.Trace("CSharpOutputDataSet::ExtractColumns");
             _strLenOrNullMapPtrs = new int*[ColumnsNumber];
@@ -51,15 +56,27 @@ public unsafe void ExtractColumns(DataFrame CSharpDataFrame)
             {
                 DataFrameColumn column = CSharpDataFrame.Columns[columnNumber];
 
+                // Determine the SQL data type for this column
+                // Prefer the incoming input column metadata when available so nvarchar metadata is preserved.
+                // Default to ANSI mapping to keep existing behavior when no metadata is supplied.
+                //
+                SqlDataType dataType = DataTypeMap[column.DataType];
+                ulong columnSize = (ulong)DataTypeSize[dataType];
+                if(inputColumns != null && inputColumns.ContainsKey(columnNumber))
+                {
+                    dataType = inputColumns[columnNumber].DataType;
+                    columnSize = inputColumns[columnNumber].Size;
+                }
+
                 // Add column metadata to a CSharpColumn dictionary
                 //
                 _columns[columnNumber] = new CSharpColumn
                 {
                     Name = column.Name,
-                    DataType = DataTypeMap[column.DataType],
+                    DataType = dataType,
                     Nullable = (short)(column.NullCount > 0 ? 1 : 0),
                     DecimalDigits = 0,
-                    Size = (ulong)DataTypeSize[DataTypeMap[column.DataType]],
+                    Size = columnSize,
                     Id = columnNumber
                 };
 
@@ -79,17 +96,16 @@ public unsafe void RetrieveColumns(
         )
         {
             Logging.Trace("CSharpOutputDataSet::RetrieveColumns");
-            fixed (void** ptrptr = _dataPtrs)
-            {
-                _handleList.Add(GCHandle.Alloc(_dataPtrs));
-                *data = ptrptr;
-            }
+            
+            // Pin the pointer arrays and get their addresses
+            //
+            GCHandle dataHandle = GCHandle.Alloc(_dataPtrs, GCHandleType.Pinned);
+            *data = (void**)dataHandle.AddrOfPinnedObject();
+            _handleList.Add(dataHandle);
 
-            fixed (int** ptrptr = _strLenOrNullMapPtrs)
-            {
-                _handleList.Add(GCHandle.Alloc(_strLenOrNullMapPtrs));
-                *strLenOrNullMap = ptrptr;
-            }
+            GCHandle strLenHandle = GCHandle.Alloc(_strLenOrNullMapPtrs, GCHandleType.Pinned);
+            *strLenOrNullMap = (int**)strLenHandle.AddrOfPinnedObject();
+            _handleList.Add(strLenHandle);
         }
 
         /// <summary>
@@ -121,13 +137,15 @@ DataFrameColumn column
         )
         {
             Logging.Trace("CSharpOutputDataSet::ExtractColumn");
-            int[] colMap = GetStrLenNullMap(column);
-            fixed(int* len = colMap)
-            {
-                _strLenOrNullMapPtrs[columnNumber] = len;
-            }
+            int[] colMap = GetStrLenNullMap(columnNumber, column);
+            GCHandle colMapHandle = GCHandle.Alloc(colMap, GCHandleType.Pinned);
+            _strLenOrNullMapPtrs[columnNumber] = (int*)colMapHandle.AddrOfPinnedObject();
+            _handleList.Add(colMapHandle);
 
-            switch(DataTypeMap[column.DataType])
+            // Use the data type already determined in ExtractColumns (which preserves nvarchar/varchar distinction)
+            // instead of DataTypeMap[column.DataType] which always maps string to DotNetChar
+            //
+            switch(_columns[columnNumber].DataType)
             {
                 case SqlDataType.DotNetInteger:
                     SetDataPtrs<int>(columnNumber, GetArray<int>(column));
@@ -176,6 +194,17 @@ DataFrameColumn column
 
                     SetDataPtrs<byte>(columnNumber, GetStringArray(column));
                     break;
+                case SqlDataType.DotNetWChar:
+                    // Preserve nvarchar metadata by emitting UTF-16 data and byte counts.
+                    //
+                    int maxUnicodeStrLen = colMap.Max();
+                    if(maxUnicodeStrLen > 0)
+                    {
+                        _columns[columnNumber].Size = (ulong)maxUnicodeStrLen;
+                    }
+
+                    SetDataPtrs<char>(columnNumber, GetUnicodeStringArray(column));
+                    break;
                 default:
                     throw new NotImplementedException("Parameter type for " + DataTypeMap[column.DataType].ToString() + " has not been implemented yet");
             }
@@ -226,49 +255,102 @@ private T[] GetArray<T>(DataFrameColumn column) where T : unmanaged
         private byte[] GetStringArray(DataFrameColumn column)
         {
             StringBuilder builder = new StringBuilder();
+            int totalBytes = 0;
             for(int rowNumber = 0; rowNumber < column.Length; ++rowNumber)
             {
                 // In case of null strings, nothing will be added to the returned data.
                 //
                 if(column[rowNumber] != null)
                 {
-                    builder.Append(column[rowNumber]);
+                    string value = (string)column[rowNumber];
+                    int byteLen = Encoding.UTF8.GetByteCount(value);
+                    Logging.Trace($"GetStringArray: Row {rowNumber}, Value='{value}', ByteLen={byteLen}, CurrentOffset={totalBytes}");
+                    builder.Append(value);
+                    totalBytes += byteLen;
+                }
+                else
+                {
+                    Logging.Trace($"GetStringArray: Row {rowNumber} is NULL");
+                }
+            }
+
+            byte[] result = Encoding.UTF8.GetBytes(builder.ToString());
+            Logging.Trace($"GetStringArray: Total buffer size={result.Length}, TotalBytesCalculated={totalBytes}");
+            return result;
+        }
+
+        /// <summary>
+        /// This method builds a contiguous UTF-16 buffer for string types (nvarchar/nchar).
+        /// </summary>
+        private char[] GetUnicodeStringArray(DataFrameColumn column)
+        {
+            StringBuilder builder = new StringBuilder();
+            int totalBytes = 0;
+            for(int rowNumber = 0; rowNumber < column.Length; ++rowNumber)
+            {
+                if(column[rowNumber] != null)
+                {
+                    string value = (string)column[rowNumber];
+                    int byteLen = Encoding.Unicode.GetByteCount(value);
+                    Logging.Trace($"GetUnicodeStringArray: Row {rowNumber}, Value='{value}', ByteLen={byteLen}, CurrentOffset={totalBytes}");
+                    builder.Append(value);
+                    totalBytes += byteLen;
+                }
+                else
+                {
+                    Logging.Trace($"GetUnicodeStringArray: Row {rowNumber} is NULL");
                 }
             }
 
-            return Encoding.UTF8.GetBytes(builder.ToString());
+            char[] result = builder.ToString().ToCharArray();
+            Logging.Trace($"GetUnicodeStringArray: Total buffer size={result.Length * sizeof(char)}, TotalBytesCalculated={totalBytes}");
+            return result;
         }
 
         /// <summary>
         /// This method gets the StrLenNullMap from a DataFrameColumn Column.
         /// </summary>
-        private int[] GetStrLenNullMap(DataFrameColumn column)
+        /// <param name="columnNumber">The column index, used to look up the correct data type from _columns</param>
+        /// <param name="column">The DataFrameColumn containing the data</param>
+        /// <returns>Array of string lengths or null indicators for each row</returns>
+        private int[] GetStrLenNullMap(ushort columnNumber, DataFrameColumn column)
         {
             int[] colMap = new int[column.Length];
-            _handleList.Add(GCHandle.Alloc(colMap, GCHandleType.Pinned));
+            
+            SqlDataType dataType = _columns[columnNumber].DataType;
+            Logging.Trace($"GetStrLenNullMap: Column {columnNumber}, DataType={dataType}, RowCount={column.Length}");
+            
             for(int rowNumber = 0; rowNumber < column.Length; ++rowNumber)
             {
                 if(column[rowNumber] != null)
                 {
-                    if(!DataTypeMap.ContainsKey(column.DataType))
-                    {
-                        throw new NotImplementedException("Parameter type for " + column.DataType.ToString() + " has not been implemented yet");
-                    }
-
-                    SqlDataType dataType = DataTypeMap[column.DataType];
                     switch(dataType)
                     {
                         case SqlDataType.DotNetChar:
-                            colMap[rowNumber] = ((string)column[rowNumber]).Length;
+                            // Must match the actual byte count from Encoding.UTF8.GetBytes()
+                            //
+                            colMap[rowNumber] = Encoding.UTF8.GetByteCount((string)column[rowNumber]);
+                            Logging.Trace($"GetStrLenNullMap: Row {rowNumber}, Value='{column[rowNumber]}', ByteLen={colMap[rowNumber]}");
+                            break;
+                        case SqlDataType.DotNetWChar:
+                            // For nvarchar output, report UTF-16 byte length to match the emitted buffer.
+                            //
+                            colMap[rowNumber] = Encoding.Unicode.GetByteCount((string)column[rowNumber]);
+                            Logging.Trace($"GetStrLenNullMap: Row {rowNumber}, Value='{column[rowNumber]}', ByteLen={colMap[rowNumber]}");
                             break;
                         default:
+                            if(!DataTypeSize.ContainsKey(dataType))
+                            {
+                                throw new NotImplementedException("Parameter type for " + dataType.ToString() + " has not been implemented yet");
+                            }
                             colMap[rowNumber] = DataTypeSize[dataType];
                             break;
                     }
                 }
                 else
                 {
                     colMap[rowNumber] = SQL_NULL_DATA;
+                    Logging.Trace($"GetStrLenNullMap: Row {rowNumber} is NULL");
                 }
             }
 
 
@@ -135,6 +135,11 @@ public unsafe void AddParam(
                 case SqlDataType.DotNetChar:
                     _params[paramNumber].Value = Interop.UTF8PtrToStr((char*)paramValue, (ulong)strLenOrNullMap);
                     break;
+                case SqlDataType.DotNetWChar:
+                    // For NCHAR/WCHAR, strLenOrNullMap contains byte length, divide by 2 to get character count
+                    //
+                    _params[paramNumber].Value = Interop.UTF16PtrToStr((char*)paramValue, strLenOrNullMap / sizeof(char));
+                    break;
                 default:
                     throw new NotImplementedException("Parameter type for " + dataType.ToString() + " has not been implemented yet");
             }
@@ -210,6 +215,15 @@ public unsafe void ReplaceParam(
                     *strLenOrNullMap = (param.Value.Length < *strLenOrNullMap) ? param.Value.Length : *strLenOrNullMap;
                     ReplaceStringParam((string)param.Value, paramValue);
                     break;
+                case SqlDataType.DotNetWChar:
+                    // For NCHAR/WCHAR, strLenOrNullMap is in bytes
+                    // param.Size is in characters, so convert to bytes for comparison
+                    //
+                    int wcharByteLen = param.Value.Length * sizeof(char);
+                    int maxByteLen = (int)param.Size * sizeof(char);
+                    *strLenOrNullMap = (wcharByteLen < maxByteLen) ? wcharByteLen : maxByteLen;
+                    ReplaceUnicodeStringParam((string)param.Value, paramValue);
+                    break;
                 default:
                     throw new NotImplementedException("Parameter type for " + param.DataType.ToString() + " has not been implemented yet");
             }
@@ -270,5 +284,33 @@ private unsafe void ReplaceStringParam(
                 }
             }
         }
+
+        /// <summary>
+        /// This method replaces parameter value for Unicode string data types.
+        /// If the string is not empty, the address of underlying Unicode bytes will be assigned to paramValue.
+        /// </summary>
+        private unsafe void ReplaceUnicodeStringParam(
+            string value,
+            void   **paramValue
+        )
+        {
+            if(string.IsNullOrEmpty(value))
+            {
+                _handleList.Add(GCHandle.Alloc(value));
+                fixed(void* strPtr = value)
+                {
+                    *paramValue = strPtr;
+                }
+            }
+            else
+            {
+                byte[] strBytes = Encoding.Unicode.GetBytes(value);
+                _handleList.Add(GCHandle.Alloc(strBytes));
+                fixed(void* strPtr = strBytes)
+                {
+                    *paramValue = strPtr;
+                }
+            }
+        }
     }
 }
@@ -192,7 +192,9 @@ public void Execute(
             if(_outputDataSet.CSharpDataFrame != null)
             {
                 _outputDataSet.ColumnsNumber = (ushort)_outputDataSet.CSharpDataFrame.Columns.Count;
-                _outputDataSet.ExtractColumns(_outputDataSet.CSharpDataFrame);
+                // Pass input column metadata to preserve data types (e.g., nvarchar vs varchar).
+                //
+                _outputDataSet.ExtractColumns(_outputDataSet.CSharpDataFrame, _inputDataSet.Columns);
                 *outputSchemaColumnsNumber = _outputDataSet.ColumnsNumber;
             }
             else
Original file line number	Diff line number	Diff line change
`@@ -46,5 +46,10 @@ private set`
`46`	`46`	`/// This dictionary contains all the columns metadata as CSharpColumn objects.`
`47`	`47`	`/// </summary>`
`48`	`48`	`protected Dictionary<ushort, CSharpColumn> _columns = new Dictionary<ushort, CSharpColumn>();`
	`49`	`+`
	`50`	`+ /// <summary>`
	`51`	`+ /// Gets the columns metadata dictionary.`
	`52`	`+ /// </summary>`
	`53`	`+ public Dictionary<ushort, CSharpColumn> Columns => _columns;`
`49`	`54`	`}`
`50`	`55`	`}`
Original file line number	Diff line number	Diff line change
`@@ -192,7 +192,9 @@ public void Execute(`
`192`	`192`	`if(_outputDataSet.CSharpDataFrame != null)`
`193`	`193`	`{`
`194`	`194`	`_outputDataSet.ColumnsNumber = (ushort)_outputDataSet.CSharpDataFrame.Columns.Count;`
`195`		`- _outputDataSet.ExtractColumns(_outputDataSet.CSharpDataFrame);`
	`195`	`+ // Pass input column metadata to preserve data types (e.g., nvarchar vs varchar).`
	`196`	`+ //`
	`197`	`+ _outputDataSet.ExtractColumns(_outputDataSet.CSharpDataFrame, _inputDataSet.Columns);`
`196`	`198`	`*outputSchemaColumnsNumber = _outputDataSet.ColumnsNumber;`
`197`	`199`	`}`
`198`	`200`	`else`