Параметры парсера

Параметры парсера

/asIs

Используйте эту опцию, чтобы отключить специальную обработку входных данных, например преобразование временных меток Yahoo Finance в значения даты и времени.

/attributedColumns=<col>.<attr>[;...]

Эта опция позволяет создавать выходные столбцы из значений атрибутов XML.

Например, Zoho CRM экспортирует данные в следующем формате:

<FL val="FirstName">John</FL>
<FL val="LastName">Doe</FL>

Чтобы извлечь значения в столбцы FirstName и LastName, используйте:

/attributedColumns=FL.val

/collapsedNodes=<node>[;...]

Используйте эту опцию, чтобы включить значения дочерних узлов XML в родительский узел.

Например, если узел XML имеет следующую структуру:

<passages>
<passage><hlword>Yandex</hlword> - the search engine that can...</passage>
</passages>

Чтобы получить один столбец passages, используйте:

/collapsedNodes=passages

/firstRow=<first row>

Эта опция позволяет указать первую строку данных во входном файле.

/firstRowHasNames

Используйте эту опцию, чтобы указать, что входные данные содержат заголовки, если утилита не обнаружила их автоматически.

Эта опция противоположна /noSourceHeaders.

Вы можете использовать эту опцию с параметром false. Например:

/firstRowHasNames=false

/hasRowNum

Эта опция указывает, что первый столбец содержит номера строк.

Вы можете опустить этот параметр, если первый столбец называется _RowNum.

Используйте эту опцию, чтобы избежать добавления дополнительного столбца вместе с опцией /addRowNum. Например:

/hasRowNum /addRowNum

Также вы можете использовать эту опцию с /addRowNum для удаления первого столбца:

/hasRowNum /addRowNum=false

/ignoredTags=<tag>[;...]

Эта опция отключает создание столбцов для указанных тегов XML.

Например, если узел XML выглядит так:

<passages>
<passage><hlword>Yandex</hlword> - the search engine that can...</passage>
</passages>

Чтобы игнорировать тег hlword, используйте:

/ignoredTags=hlword

/inputCodePage=<codepage>

Эта опция позволяет указать кодовую страницу входного файла.

Например:

/inputcodepage=65001

/inputDateFormat=DMY | MDY

Эта опция задает порядок даты и месяца для входных данных.

gsqlcmd пытается определить этот порядок автоматически, но вам нужно указать его вручную, если столбец содержит только даты в формате 12.01.2019 или 01.12.2019, что затрудняет автоматическое определение.

/inputSeparator=<separator> | Tab

Эта опция позволяет указать разделитель входного CSV.

gsqlcmd обычно определяет его автоматически.

/keptNodes=<node>[;...]

Используйте эту опцию, чтобы указать узлы XML и JSON, которые будут добавлены к выходным данным, даже если они не имеют значений.

Этот параметр позволяет сохранять одинаковые выходные столбцы для файлов с небольшими наборами данных, когда некоторые столбцы могут быть пустыми.

/noSourceHeaders

Эта опция используется, если первая строка CSV и текстовых файлов или заголовков таблицы HTML не содержит имен столбцов.

В этом случае gsqlcmd создаст столбцы с именами F1, F2 и т.д.

Эта опция полезна для финансовых отчетов, где в качестве заголовков используются годы или кварталы.

Эта опция противоположна /firstRowHasNames.

/numberFields=<field>[<separator>...]

Эта опция принудительно преобразует значения столбца в числа.

Например:

/numberColumns=Open;High;Low;Close;Volume

Без этой опции gsqlcmd пропустит преобразование столбца, если хотя бы одна ячейка содержит значение, которое не может быть преобразовано.

/requiredColumns=<name>[;...]

Эта опция позволяет определить столбцы, необходимые для вывода.

gsqlcmd пропустит вывод для файла, если он не содержит указанных столбцов.

Например, если вы хотите загрузить дивиденды для списка тикеров, и компания не выплачивает дивиденды, страница будет пустой. Укажите необходимые выходные столбцы, чтобы пропускать такие страницы:

gsqlcmd convert https://www.nasdaq.com/symbol/aapl/dividend-history aapl.csv /requiredColumns=ExEffDate;Type

/rootPath=<path>[;...]

Эта опция позволяет явно определить корневые выходные столбцы.

Вот несколько примеров для источников XML, JSON и HTML:

/rootPath=.InvoiceTransmission.Invoice
/rootPath=calls,puts
/rootpath=*.*.timestamp,*.*.*.quote,*.*.*.adjclose
/rootPath=1

Без этой опции gsqlcmd автоматически определяет выходные столбцы.

Используйте режим show-roots, чтобы получить корневые узлы для файлов XML и JSON.

Используйте режим show-html-tables, чтобы получить номера таблиц, используемые в качестве корневых для файлов HTML.

gsqlcmd поддерживает несколько корней для JSON и HTML и один корень для XML.

/skippedNodes=<node>[;...]

Эта опция исключает узлы XML или JSON из выходных данных.

Вы можете указать пути к столбцам, например parent1.parent2.column, или суффиксы, например .column.

Например, чтобы исключить столбцы type с типами данных, используйте:

/skippedNodes=.type

/stringFields=<field>[<separator>...]

Эта опция позволяет пропустить преобразование значений столбца в числа.

Например, используйте эту опцию, чтобы сохранить такие значения, как "2.10", в виде строк.

Без этой опции инструмент преобразует значение в числовое значение 2.1.

Например, чтобы сохранять версии и почтовые индексы в полях Version и ZipCode в виде строк, используйте:

/stringColumns=Version;ZipCode

Этот веб-сайт использует куки. Продолжая использовать веб-сайт, Вы принимаете условия Политики защиты персональных данных.