<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
Paul Kienzle’s email to the NeXus Mailing List made me go and check some of the files in the ExampleData repository. I think at some point, we have to go through them to make sure they conform to the latest version of the standard. Since the purpose of this
 directory is to provide people with working examples, we need to make sure that they don’t lead people astray. Perhaps non-standard-conforming legacy files can be put in a subdirectory.
<div class=""><br class="">
</div>
<div class="">One issue I came across is that the Soleil examples use Unicode characters for their units (e.g., Angstrom) with ISO-8859-1 encoding ('\xc5'), rather than the UTF-8 encoding that HDF5 uses for variable-length strings. I had a quick Google of the
<a href="http://nexusformat.org" class="">nexusformat.org</a> site, and couldn’t find a definitive answer concerning how we treat unicode characters. I don’t know if it’s embedded in a PDF anywhere. If we have not defined an encoding, then I think we should
 define ‘UTF-8’ as officially recommended, and enforce it in the API.</div>
<div class=""><br class="">
</div>
<div class="">I presume the Soleil files were created before we deprecated HDF4, so it was arbitrary. I don’t think there is a field in their file to state what the encoding is, so I’m not sure how to handle this in NeXpy. I guess I could assume ISO-8859-1
 if UTF-8 triggers an exception.</div>
<div class=""><br class="">
</div>
<div class="">Ray</div>
<div class="">
<div class="">
<div apple-content-edited="true" class="">-- <br class="">
Ray Osborn, Senior Scientist<br class="">
Materials Science Division<br class="">
Argonne National Laboratory<br class="">
Argonne, IL 60439, USA<br class="">
Phone: +1 (630) 252-9011<br class="">
Email: <a href="mailto:ROsborn@anl.gov" class="">ROsborn@anl.gov</a><br class="">
<br class="">
</div>
<br class="">
</div>
</div>
</body>
</html>