Параметры парсера
/asIs
Используйте эту опцию, чтобы отключить специальную обработку входных данных, например преобразование временных меток Yahoo Finance в значения даты и времени.
/attributedColumns=<col>.<attr>[;...]
Эта опция позволяет создавать выходные столбцы из значений атрибутов XML.
Например, Zoho CRM экспортирует данные в следующем формате:
<FL val="FirstName">John</FL> <FL val="LastName">Doe</FL>
Чтобы извлечь значения в столбцы FirstName и LastName, используйте:
/attributedColumns=FL.val
/collapsedNodes=<node>[;...]
Используйте эту опцию, чтобы включить значения дочерних узлов XML в родительский узел.
Например, если узел XML имеет следующую структуру:
<passages> <passage><hlword>Yandex</hlword> - the search engine that can...</passage> </passages>
Чтобы получить один столбец passages, используйте:
/collapsedNodes=passages
/firstRow=<first row>
Эта опция позволяет указать первую строку данных во входном файле.
/firstRowHasNames
Используйте эту опцию, чтобы указать, что входные данные содержат заголовки, если утилита не обнаружила их автоматически.
Эта опция противоположна /noSourceHeaders.
Вы можете использовать эту опцию с параметром false. Например:
/firstRowHasNames=false
/hasRowNum
Эта опция указывает, что первый столбец содержит номера строк.
Вы можете опустить этот параметр, если первый столбец называется _RowNum.
Используйте эту опцию, чтобы избежать добавления дополнительного столбца вместе с опцией /addRowNum. Например:
/hasRowNum /addRowNum
Также вы можете использовать эту опцию с /addRowNum для удаления первого столбца:
/hasRowNum /addRowNum=false
/ignoredTags=<tag>[;...]
Эта опция отключает создание столбцов для указанных тегов XML.
Например, если узел XML выглядит так:
<passages> <passage><hlword>Yandex</hlword> - the search engine that can...</passage> </passages>
Чтобы игнорировать тег hlword, используйте:
/ignoredTags=hlword
/inputCodePage=<codepage>
Эта опция позволяет указать кодовую страницу входного файла.
Например:
/inputcodepage=65001
/inputDateFormat=DMY | MDY
Эта опция задает порядок даты и месяца для входных данных.
gsqlcmd пытается определить этот порядок автоматически, но вам нужно указать его вручную, если столбец содержит только даты в формате 12.01.2019 или 01.12.2019, что затрудняет автоматическое определение.
/inputSeparator=<separator> | Tab
Эта опция позволяет указать разделитель входного CSV.
gsqlcmd обычно определяет его автоматически.
/keptNodes=<node>[;...]
Используйте эту опцию, чтобы указать узлы XML и JSON, которые будут добавлены к выходным данным, даже если они не имеют значений.
Этот параметр позволяет сохранять одинаковые выходные столбцы для файлов с небольшими наборами данных, когда некоторые столбцы могут быть пустыми.
/noSourceHeaders
Эта опция используется, если первая строка CSV и текстовых файлов или заголовков таблицы HTML не содержит имен столбцов.
В этом случае gsqlcmd создаст столбцы с именами F1, F2 и т.д.
Эта опция полезна для финансовых отчетов, где в качестве заголовков используются годы или кварталы.
Эта опция противоположна /firstRowHasNames.
/numberFields=<field>[<separator>...]
Эта опция принудительно преобразует значения столбца в числа.
Например:
/numberColumns=Open;High;Low;Close;Volume
Без этой опции gsqlcmd пропустит преобразование столбца, если хотя бы одна ячейка содержит значение, которое не может быть преобразовано.
/requiredColumns=<name>[;...]
Эта опция позволяет определить столбцы, необходимые для вывода.
gsqlcmd пропустит вывод для файла, если он не содержит указанных столбцов.
Например, если вы хотите загрузить дивиденды для списка тикеров, и компания не выплачивает дивиденды, страница будет пустой. Укажите необходимые выходные столбцы, чтобы пропускать такие страницы:
gsqlcmd convert https://www.nasdaq.com/symbol/aapl/dividend-history aapl.csv /requiredColumns=ExEffDate;Type
/rootPath=<path>[;...]
Эта опция позволяет явно определить корневые выходные столбцы.
Вот несколько примеров для источников XML, JSON и HTML:
/rootPath=.InvoiceTransmission.Invoice /rootPath=calls,puts /rootpath=*.*.timestamp,*.*.*.quote,*.*.*.adjclose /rootPath=1
Без этой опции gsqlcmd автоматически определяет выходные столбцы.
Используйте режим show-roots, чтобы получить корневые узлы для файлов XML и JSON.
Используйте режим show-html-tables, чтобы получить номера таблиц, используемые в качестве корневых для файлов HTML.
gsqlcmd поддерживает несколько корней для JSON и HTML и один корень для XML.
/skippedNodes=<node>[;...]
Эта опция исключает узлы XML или JSON из выходных данных.
Вы можете указать пути к столбцам, например parent1.parent2.column, или суффиксы, например .column.
Например, чтобы исключить столбцы type с типами данных, используйте:
/skippedNodes=.type
/stringFields=<field>[<separator>...]
Эта опция позволяет пропустить преобразование значений столбца в числа.
Например, используйте эту опцию, чтобы сохранить такие значения, как "2.10", в виде строк.
Без этой опции инструмент преобразует значение в числовое значение 2.1.
Например, чтобы сохранять версии и почтовые индексы в полях Version и ZipCode в виде строк, используйте:
/stringColumns=Version;ZipCode