View Issue Details
ID | Project | Category | View Status | Date Submitted | Last Update |
---|---|---|---|---|---|
0001424 | UkrBIN (ukrbin.com) | General | public | 2018-06-02 20:50 | 2019-04-08 05:47 |
Reporter | MGhazali | Assigned To | barry | ||
Priority | immediate | Severity | crash | Reproducibility | have not tried |
Status | closed | Resolution | fixed | ||
Summary | 0001424: проекты csv: не распознает буквы + оформление csv | ||||
Description | ПРО БУКВЫ: 1) Буквы типа ä š ü не распознаются. Я добавляю их в колонку GLocality (я так понимаю сюда идет обычное название локалитета, просто тектосовое географическое поле и в итоге будет в колонке Location - т.е. сопоставления с базой нету). Обрывает все буквы, которые идут после символов с диакритическими значками. Специально проверила кириллицу - превращается в ?????????? (но латинские буквы из той же ячейки сохраняются). Это можно исправить? ПРО КОЛОНКИ csv: 2) не понятно в какую колонку csv файла надо вводить текст, чтобы он отражался в колонке Description таблицы проекта. И еще в csv есть поле Reference - мне бы хотелось туда поместить ссылку на библиографию и чтобы она отражалась в таблице проекта/материала (как это в Distribution - пиктограмка "книжечка"), но эта колонка вообще никуда не уходит. 3) можна сделать так, чтобы в csv оставлять только нужные мне колонки (обязательно сохраняя их имя - например, Key4, Key, Date, LatDeg, LongDeg)? И чтобы система сама подхватывала нужные ей значения из колонок и расставляла, куда ей надо. Сейчас идет проверка на наличие 26 колонок. Это неудобно, так надо повозиться с файлом, расставляя свои колонки по местам. Если бы проверка шла только на имена колонок, то в своем файле надо только переназвать колонки. ПРО ССЫЛКИ: 4) bbcode не работают здесь. А можно их сделать работающими? Для колонки Note (в csv) - наверное, эта колонка должна пойти в Description (таблицы проекта), но не идет. | ||||
Steps To Reproduce | Неадекватное чтение CSV Названия видов содержащие одинаковые слова читаются только как род Пример. Carassius carassius из CSV файла прочитывается как Carassius Система ошибается с распознанием названия вида если есть конкурирующее название содержащие одинаковые слова видового эпитета Пример. Primula minima из CSV файла автоматом прочитывается как Uluguruella minima! Это делает функцию закачки CSV неадекватной! | ||||
Tags | No tags attached. | ||||
|
+ не могу понять, почему не подхватывает даты. http://barry.exp-host.ru/tracker/view.php?id=1422 В моем csv-файле из (0001424) "видит" 4 и 5 строки (с датой 9.11.2012). Но не видит много других дат оформленных также, например в 1-й строке 27.07.2011 |
|
прикрепите сюда проблемный файл |
|
" bbcode не работают здесь" здесь - в смысле в трекере? Трекер это отдельный программный продукт, который развивается независимо. Можно пообщаться с разработчиком. В принципе к данной проблеме это отношения не имеет. --- насчет 2, 3 - Николай придумывал формат, надо согласовать спецификацию. Можно в принципе и поля переставлять и добавить / удалить / сделать опциональными. Должно быть просто общее согласованное решение, я же не могу под каждого свой импорт делать. |
|
Неадекватное чтение CSV Названия видов, содержащие одинаковые слова читаются только как род Пример. Carassius carassius из CSV файла прочитывается как Carassius Система ошибается с распознанием названия вида, если есть конкурирующее название, содержащие одинаковые слова видового эпитета Пример. Primula minima из CSV файла автоматом прочитывается как Uluguruella minima! Это делает функцию закачки CSV неадекватной! |
|
пример файла ошибочно импортируемого |
|
вот это файл. Я после импорта вручную проставлял таксоны гду они были неверно подхвачены https://www.dropbox.com/s/qv79k14czmj3jns/Fishes_Demchenko.csv?dl=0 |
|
+fixed Carassius carassius из CSV файла прочитывается как Carassius |
|
Насчет букв - они действительно есть в текстовом файле CSV? В этом примере я вижу вопросы - "Sea of ??Azov": 812;cultratus Pelecus;Ukraine;Zaporizhia;;Stepanivka persha;Sea of ??Azov;16 04 1997;;Demchenko V., Demchenko N.;;;;46.447707;35.497611;;1;;;;;;;;; Может буквы есть нормальные в исходном XLS, а теряются при записи в CSV? Но я тут ничего не сделаю, я же CSV читаю. По-моему мы уже с татарскими буквами пытались разбираться, получалось Excel в CSV их не писал. |
|
Насчет колонки описания и произвольного порядка полей - я у же писал. Текущий вариант делался под определенное ТЗ с фиксированным набором полей, Николая устраивало. Давайте тогда делать новое Техническое Задание с подробным описанием. Чтоб это было задокументировано и всем понятно, чтобы все могли ознакомиться. Сегодня Вы захотите одно, завтра другой что-то другое, в результате Ваш вариант работать перестанет... Давайте тогда как-то обобщим более удобную модель для импорта. |
|
Похоже, это касается всех не латинских букв. А в чем принципиальная причина с Carassius carassius и другими случаями? Может быть стоит для поле Key вернуть написание Род вид, вместо нынешнего вид Род? |
|
Carassius carassius я же написал что уже должно быть нормально. |
|
Что касается всех не латинских букв? |
|
Ты мне обещал пример с татарскими буквами еще пару лет назад. |
|
могу дать сколько угодно, но проблема не только с турецкой (или как ты называешь, татарской) азбукой. Главное то, что проблема с кириллицей на которой наши языки и почти все пользователи пишут кириллицей, что в экспортированных CSV при открытии в Excel превращается в абракадабру. Изменить реальность, что 99% пользуются именно Excel невозможно, поэтому очень важно решить эту проблему с кодировками, иначе у нас проблемы с датасетами. |
|
про Carassius carassius я имел ввиду, можно ли посмотреть, что ты менял в коде чтобы решить проблему? |
|
Насчет Carassius carassius - менял запрос на поиск таксона. Насчет букв еще раз - они в самом файле CSV нормальные? |
|
Я стал копаться в проблеме трансформации CSV. Твой код тут не при чем. Кирилица и турецкие буквы летят при самой трансформации. Надо думать в чем делать CSV чтоб это не происходило Вот что пишет сам майкрософт про ету проблему трансформации Excel formatting and features that are not transferred to other file formats CSV (Comma delimited) This format (.csv) saves only the text and values as they are displayed in cells of the active worksheet. All rows and all characters in each cell are saved. Columns of data are separated by commas, and each row of data ends in a carriage return. If a cell contains a comma, the cell contents are enclosed in double quotation marks. If cells display formulas instead of formula values, the formulas are converted as text. All formatting, graphics, objects, and other worksheet contents are lost. The euro symbol will be converted to a question mark. Note If your workbook contains special font characters such as a copyright symbol (©), and you will be using the converted text file on a computer with a different operating system, save the workbook in the text file format that is appropriate for that system. For example, if you are using Windows and want to use the text file on a Macintosh computer, save the file in the CSV (Macintosh) format. If you are using a Macintosh computer and want to use the text file on a system running Windows or Windows NT, save the file in the CSV (Windows) format. |
|
закрываем? |
Date Modified | Username | Field | Change |
---|---|---|---|
2018-06-02 20:50 | MGhazali | New Issue | |
2018-06-02 23:16 | MGhazali | Note Added: 0003774 | |
2018-12-07 11:15 | barry | Note Added: 0003979 | |
2018-12-07 11:22 | barry | Note Added: 0003980 | |
2018-12-07 11:22 | barry | Assigned To | => barry |
2018-12-07 11:22 | barry | Status | new => acknowledged |
2019-02-22 02:06 | Nikolai Yunakov | Priority | normal => immediate |
2019-02-22 02:06 | Nikolai Yunakov | Severity | minor => crash |
2019-02-22 02:06 | Nikolai Yunakov | Status | acknowledged => assigned |
2019-02-22 02:06 | Nikolai Yunakov | Steps to Reproduce Updated | View Revisions |
2019-02-22 02:06 | Nikolai Yunakov | Note Added: 0004007 | |
2019-02-22 02:07 | Nikolai Yunakov | Note Edited: 0004007 | View Revisions |
2019-03-26 11:33 | barry | Note Added: 0004022 | |
2019-03-26 17:42 | Nikolai Yunakov | Note Added: 0004024 | |
2019-04-01 19:42 | barry | Note Added: 0004032 | |
2019-04-01 19:51 | barry | Note Added: 0004033 | |
2019-04-01 19:57 | barry | Note Added: 0004034 | |
2019-04-01 22:37 | Nikolai Yunakov | Note Added: 0004035 | |
2019-04-01 22:39 | Nikolai Yunakov | Note Edited: 0004035 | View Revisions |
2019-04-02 10:19 | barry | Note Added: 0004037 | |
2019-04-02 10:20 | barry | Note Added: 0004038 | |
2019-04-02 10:20 | barry | Note Added: 0004039 | |
2019-04-02 22:14 | Nikolai Yunakov | Note Added: 0004040 | |
2019-04-02 22:16 | Nikolai Yunakov | Note Added: 0004041 | |
2019-04-03 13:56 | barry | Note Added: 0004042 | |
2019-04-03 16:00 | Nikolai Yunakov | Note Added: 0004043 | |
2019-04-04 11:24 | barry | Note Added: 0004045 | |
2019-04-04 11:25 | barry | Status | assigned => resolved |
2019-04-04 11:25 | barry | Resolution | open => fixed |
2019-04-08 05:47 | Nikolai Yunakov | Status | resolved => closed |